非主流自然语言处理——遗忘算法系列(五):文本相似度
非主流自然语言处理——遗忘算法系列(五):文本相似度

一、前言前文介绍了词权重的计算方法,本篇介绍词权重的另一种应用:文本相似度计算。二、算法原理文本相似度计算的方法很多,我们这里通过计算“两篇文本中都出现的词汇的权重占比”来衡量相似的程度,具体计算公式如下:词的

2022-04-26 11:56:48
《自然语言处理实战入门》---- 第1课:自然语言处理简介
《自然语言处理实战入门》---- 第1课:自然语言处理简介

本博客为《自然语言处理实战课程》----第一课:自然语言处理简介讲稿文章大纲个人简介本节课程导览1.自然语言处理(NLP)简介1.1基础技术1.2NLP核心技术1.3NLP+(高端技术)1.4课程涵盖的主要内容总揽

2022-04-26 11:57:01
自然语言处理NLP概述
自然语言处理NLP概述

目录 1.自然语言处理概述1.1什么是NLP1.2NLP的难度是什么1.3NLP相关的技术2.NLP常用库2.1NLTK2.2TextBlob2.3Gensim2.4Pattern2.5SpaCy2

2022-04-26 11:57:12
智能金融的三驾马车之自然语言处理NLP
智能金融的三驾马车之自然语言处理NLP

什么是自然语言处理NLP用通俗的话来讲,自然语言处理NLP的目标是让机器能够理解人类的语言,NLP就是人和机器进行交流的技术。用专业语言来讲,自然语言处理有狭义和广义之分。狭义的自然语言处理是使用计算机来完成以自然语言为载体的非结构化信息

2022-04-26 11:57:15
【NLP技术】:NLP简单介绍
【NLP技术】:NLP简单介绍

文章目录1.前言2.文本预处理2.1去噪声2.2词汇归一化2.3目标标准化3.特征工程3.1句法分析3.2实体提取3.3统计特征3.4词嵌入(文本向量)4.NLP的重要任务4.1文本分类4.2文本匹配/相似

2022-04-26 11:56:59
用pattern进行自然语言处理
用pattern进行自然语言处理

http://www.clips.ua.ac.be/patternpattern是一个网络数据挖掘的一个工具,分为几个模块pattern.web是用来在网络抓取数据的,pattern.en是用来处理英文文本的

2022-04-26 11:56:57
将PDF和Gutenberg文档格式转换为文本:生产中的自然语言处理
将PDF和Gutenberg文档格式转换为文本:生产中的自然语言处理

Estimatesstatethat70%–85%oftheworld’sdataistext(unstructureddata).MostoftheEnglishandEUbusinessdataf

2022-04-26 11:56:53
【招聘】智联NLP算法工程师
【招聘】智联NLP算法工程师

点击上方,选择星标或置顶,每天给你送干货!智联(资深/高级)NLP算法工程师岗位职责:对海量文本进行分析挖掘;文本分类,主题模型,关键词抽取,命名实体识别Query理解和用户画像建设对简历和职位进行内容抽取和分类岗位要求:

2022-04-26 11:56:59
中文自然语言处理NLP
中文自然语言处理NLP

1.NLP流程和开元框架近年来,随着互联网的发展,计算机处理自然语言的需求变得越来越迫切,除了比较悠久的机器翻译外,自然语言处理在信息检索、信息抽取、数据挖掘、舆情分析、文本摘要、自动问答系统等方面都获得了很广泛的应用。  有关自然语

2022-04-26 11:57:13
自然语言处理实验—分词算法(含python代码及详细例子讲解)
自然语言处理实验—分词算法(含python代码及详细例子讲解)

自然语言处理实验—分词算法最近在学自然语言处理,这是第一个上机实验自然语言处理的分词算法,也是自然语言处理比较入门的算法。和大家分享一下。首先,自然语言处理,英文是(NatureLanguageProcess),简称“NLP"。是人

2022-04-26 11:57:18