发新话题
打印

语言与人工智能:围绕 NLP 的争论

语言与人工智能:围绕 NLP 的争论

毫无疑问,西班牙语是一门丰富的语言,受到历史和文化交流的影响,而且现在也遇到了技术。改变总是伴随着恐惧和适应。人们担心这种丰富性将会消失,通用技术将使我们的语言“正常化”,而实际上它可以恢复细微差别并增强它们。我们需要适应人工智能和语言技术,利用它们以数字方式开发西班牙语,了解最新情况并决定我们想要如何改变。 面对这一不可避免的数字化转型,我们从哪里开始?巴斯克大学 Hitz 中心 PLN 的 Ramón y Cajal 研究员 Rodrigo Agerri 在第十四届国际语言与新闻研讨会最后一次圆桌会议上指出:“非结构化内容代表了 90% 的信息”。这就是语言技术发挥作用的地方,特别是自然语言处理(NLP),这是今年版本的必要主题:西班牙语和机器:语言、伦理和新闻。

每秒有数以千计的帖子、搜索和消息,还有新闻、健康报告 塞内加尔电话号码 和专利文件。所有这些文本都“隐藏”了有用的信息,也许许多问题源于我们不知道的事实:“我们知道语言技术正在被使用,但我们不知道我们拥有的可用信息未经治疗,”罗德里戈·阿杰里说。 我们用 PLN 做什么? 自然语言处理 (NLP) 自动与人类语言(文本和语音)一起工作,简化与信息管理和搜索或自动翻译相关的任务。关于西班牙语中NLP 的最新技术,我们知道它在哪里,如何开始应用它,如何让它为人所知,以及为什么不保养它。 不同行业的 PLN 我们不会在所有环境或所有领域都讲相同的内容,也不会写相同的所有文本和文件。例如,根据行业的不同,我们使用的语言结构和我们选择表达自己的词语会发生变化。 这就是存在领域的原因:社交网络、医学文本、法律文档……每一个领域都会产生自动文本处理的特定问题,即使它们是同一种语言。我们讨论术语、技术细节和其他正式公式。



反过来,每个部门都需要不同的应用程序:特定搜索、关联信息、对其进行分类。 机器学习 因此,主持圆桌会议的记者兼作家 Esteban Hernández 提议首先为PLN 的某些领域和应用提供临时资源。“语言技术必须主导这些新的通信场景,”他解释道。它还提到考虑新术语、缩写甚至表情符号。 PLN 是横向的 考虑到这些机会,考虑到技术是横向的并应用于所有领域的现实,我们必须知道它能为我们提供什么。只有这样,我们才能知道自己想要什么,才能成功推进西班牙语自然语言处理的发展。 这是知识工程研究所(IIC)计算语言学家Carmen Torrijos的提议。对她来说,“忽视自然语言处理技术意味着许多流程的质量下降,并且总体上阻碍了进步。” 必须让人们知道这一点、产生的需求以及必要的投资。

TOP

发新话题