目前的自然语言处理技术的发展,依然面临如下问题:
(1)不同的自然语言处理机制之间缺乏融合;
(2)自然语言处理技术与人工智能研究的其他技术缺乏彼此融合;
(3)基于大数据的自然语言处理技术的运作必须以“剥削”人类的智能为前提;
(4)基于大数据的自然语言处理技术缺乏灵活处理隐喻、反讽、双关等修辞现象的能力。
这些问题所涉及的主要哲学问题有:
(1)语言是外部世界的表征,还是言说者内部世界的表征?
(2)语言中的规则,究竟是先验的,还是经验的?
(3)语言表征与言说者的心理活动之间的关系为何?
(4)与语言表征有关的认知构架,在多大程度上需要被“具身化”?
NLP问题的研究的确对整个AI的研究来说具有指标性的意义。但对于该问题的哲学面相的了解,却一直没有被NLP学界所充分地意识到。毋宁说,目前NLP学界研究的话题取向是完全被偶然的工程学需求或商业需求所牵导的,而缺乏哲学(甚至是科学)层面上的整体谋划。更有甚者,在笔者所了解的范围内,语言哲学界目前也缺乏全面介入NLP研究的充分理论冲动。这种“两张皮互不相扰”的状态显然是不能让人满意的。此外,同样令人感到担忧的是,随着国际科技竞争与交流环境的改变,国内很多与AI相关的投资方向都被集中到了精密芯片的制造行业,与之同时,投向貌似更“虚”的AI架构研究的注意力却明显不足。殊不知工程师们对于高性能芯片算力的无休止的索求,在哲学层面上就已经预设了优秀的NLP机制与其它AI机制的运作乃是基于大数据的(因为只有海量的数据才会倒逼人们去寻找巨大的算力与之匹配)。然而,在前文的分析中我们已经看到了,这一预设本身可能就是错误的,因为语言机制运作之本质,便是通过对于少量核心规则与核心词汇的掌握而具备创生出海量的表达式的潜能——而并非是通过对于海量的现成的表达式的构建方式的模仿,建立出一个又一个“特设”(adhoc)的语言模型,最终陷入“以有涯追无涯”的困境。从这个角度看,目前全球的NLP研究也好,整个AI工业也罢,都尚且处在“盲人摸象”的阶段,而尚且远远没有资格戴上“成熟科学”的王冠。