HAL也应该能够做信息检索(information retrieval,发现它所需要的文本资源在哪里)和信息抽取(information extraction,从文本资源中抽取它所需要的信息),并且进行知识推理(reference,根据已知的事实推出结论)。 尽管这些问题现在还远远没有完全解决,HAL需要的一些与语言相关的技术现在已经研制出来了,有一部分技术已经商品化。解决这样的问题以及其他类似的问题,是自然语言处理、计算语言学、语音识别与语音合成的主要研究内容。我们把它们统称为语音与语言的计算机处理(speech and language processing),或者简单地称为自然语言处理(natural language processing),因此,自然语言处理也同时包括了语音处理的内容。 像HAL这样有复杂的语言能力的智能机器人将要求非常广泛和深刻的语言知识。我们只要读一读前面在。HAL和Dave之间进行的对话,我们就可以了解到这样的更加复杂的应用所需要的语言知识的范围和种类。 为了确定Dave讲什么,HAL必须能够分析它所接收的声音信号,并且把Dave的这些信号复原成词的系列。与此相似,为了生成回答,HAL必须把它的回答组织成词的系列,并且生成Dave能够识别的声音信号。要完成这两方面的任务,需要语音学(phonetics)和音系学(phonology)的知识,这样的知识可以帮助我们建立词如何在话语中发音的模型。 值得注意的是,HAL还能够说出如像Im和cant这样的缩约形式,HAL必须把它们分别还原为I am和can not,才能在它的词库中找到这些单词的对应物,从而明白这些缩约形式究竟代表什么样的语言成分。HAL还要能够产生并且识别单词的这样或那样的变体(例如,识别doors是复数)。这些都要求HAL具有形态学方面的知识,这些知识能够反映关于上下文中词的形态和行为的有关信息。 除了处理一个一个的单词之外,HAL还应该知道怎样分析Dave所提出的请求的结构。这样的分析能够使HAL确定,Dave说的话是关于要HAL采取某种行动的一个请求,这样的请求不同于下面关于陈述客观世界的简单命题,也不同于下面关于door的问话,它们是Dave请求的不同变体: HAL,the pod bay door is open.(HAL,分离舱的门是开着的。) HAL,is the pod bay door open?(HAL,分离舱的门是开着的吗?) 此外,HAL还必须使用类似的结构知识把一个个的单词组织成为符号串,构成它的回答。例如,HAL必须知道,下面的单词序列对于Dave是没有意义的,尽管这个单词系列所包含的单词与它原来的回答中所包含的单词完全一样: Im I do,Sorry that afraid Dave Im cant. 这里所说的关于组词成句的知识,叫做句法(syntax)。 显而易见,如果只是知道Dave所说的话语的各个单词以及句法结构,并不能使HAL了解Dave提出的请求的实质。为了理解Dave的请求事实上是关于要求关闭pod bay door(分离舱门)的一个命令,而不是讲关于当天中饭的菜单的事情,就要有复合词的语义的知识、词汇语义学(lexical semantics)的知识以及如何把这样的复合词组成更大的意义的知识,即关于组合语义学(compositional semantics)的知识。