「 BOOK 」 七月 09, 2023
《自然语言处理实战》书摘
文章字数 28k 阅读约需 25 mins.
自然语言通常所指的不仅是文本数据,还包括语音和声音数据。
1.1.1 热门应用
自然语言生成的一个流行的商业应用是“数据到文本”的软件系统,它生成数据库和数据集的文本摘要。
自然语言处理的一个主要挑战是从非结构化或半结构化的文档集合中创建结构化的数据。例如,命名实体识别软件能够从主流新闻等长篇文本中提取任务、组织、地点、日期和货币。信息提取还包括关系提取,如果实体之间存在关系,则提取相应的关系。
1.2.1 定义自然语言处理任务
查看全文分词、词性标注、依存句法分析、组块、词形还原和词干提取是...