站在RPA的角度浅谈NLP自然语言处理

实在智能|
2022年01月17日|
行业解读

语言处理的本质是语言到逻辑,以及逻辑到语言的转换,或者说本质是符号之间的转换;

符号之间的转换的目的,是为了降低信息摩擦成本,提高信息交流速度。无论在何种体系构架,即便成为缸中之脑或者数字信号生物,都永远存在符号之间的转换问题。

自然语言的本质是语言处理

没有什么是绝对自然的,或者无论什么都是绝对自然的,所以自然这个词并没有实际意义。

而什么是语言处理呢,这里要说什么是语言,而实际上,任何东西都是语言!

因为语言从宏观看,就是一种信号而已,我们一般可能只能想到连续信号(例如声音),或者离散信号(例如文字),是语言。但是实际上什么都是语言。

我们可以说键盘的敲击声是语言,我们可以说外面的鸟叫声是语言,我们可以说图片是语言的二维连续表示,视频是语言的三维连续表示,我们可以说股价是股票的“呐喊”……所以语言处理的本质就是处理各种或连续,或离散的信号而已。

为什么呢,因为这些信号是包含语义的,或者说,除非是纯粹的随机噪音,都包含和其他变量的关系,而这种关系我们就可以认为是一种意义、语义。而解读这些语义,我们都可以认为是语言处理的范畴。

PS:你说有没有把图片、视频转换作为语言处理的例子?是有的,例如Image Caption任务,就是给你一张图片,输出一句对这个图片描述的话,我们当然可以说这个任务就是一种符号到另一种符号的语言处理任务。

语言处理的本质是语符号之间的转换

我们说最简单的文本分类,例如新闻分类,区分是体育新闻、娱乐新闻、还是什么。它就是一种从某种符号(人类语言)到林一种符号(逻辑分类符号)的转换,当然可以说是一种符号到符号的转换。

甚至我们说预测股价,都可以说是从一种连续符号(股票的呐喊),到另一种符号(例如定义什么是涨跌平),的符号转换。

也就是说,NLP这个概念,本质上是可以包含任何符号转换的含义在其内,只需要把符号定义清楚即可。

语言处理提高信息交流速度

举个例子,假设一个生物,每天必须摄取足够的蛋白质才能生存,并且获取的蛋白质越多越好,那么它会怎么发展?

显而易见,这样的生物会越来越被高蛋白食物吸引,对蛋白质存在量越高的食物越喜欢,因为它的单位时间是有限的,寿命是有限的。

也就是说假设这个生物存在一个饲主,那么这个主人如果目的是为了满足这个生物,也必然应该提供蛋白质含量高的食物。

如果我们把蛋白质比做信息,这个生物就是人,假设这个人也渴望接触更多信息量的内容,但是每个人因为传输速度受限制(例如阅读速度有限,每天可阅读时间有限,寿命有限),每天能获取的信息是有限的,那么人也应该在单位时间内接触更高信息量的内容才对。

那么给人提供信息的饲主是什么?在今天,就是谷歌、百度、脸书、今日头条……

而这些饲主如何提高针对每个人的信息量?那就是先把每个食物(每条信息)先分析一下(语言处理),然后给选择对特定人蛋白质高(信息量高)的信息。

是的,这就是搜索与推荐,它的目的就是为了提高信息筛选速度、信息处理速度。

当然了,这只是语言处理的一角。

实际上所有人都这在个过程中,并且机器能代替、辅助的部分其实还很少。

搜索引擎是提高你自己收集信息、处理信息的速度。例如你的目的是用这些信息给领导写一份报告,本质上是提高看这个报告的人(例如你的boss)的信息筛选与处理速度。

信号同步

也就是说,我们可以认为,只要两个“信号”,有“同步”的需要,那么就需要语言处理以及相关技术。

无论这个需要同步的信号是机器与人,还是人与人,还是机器与机器,都是如此。

未来从自然语言处理开始,但永远不会终止。

本文由自然语言处理提供,https://www.ai-indeed.com

标签:AI+RPANLP实在智能RPA机器人

免费试用实在RPA
你可能也喜欢
RPA企业:实在智能闪耀高科技高成长企业年度峰会,荣获3项大奖
2022年05月24日
RPA应用的现状与未来:实在智能荣膺年度最佳RPA企业,闪耀ISIG中国产业智能大会!
2022年05月24日
双料认可!实在智能获评2021AI趋势先锋Insight、最具商业价值解决方案TOP30
2022年05月24日
实在RPA·看见未来
扫码咨询
电话咨询
400-1399-089
邮箱咨询
contact@i-i.ai
回到顶部