首页 > 都市言情 > 穿越:2014 > 第152章 伊芙卡莉的困惑(续)

第152章 伊芙卡莉的困惑(续)(1/2)

目录
好书推荐: 读弟弟笔记,姐姐直播中练成雷法 人在斗破:开局觉醒酒剑仙系统 魔卡时代,我带着神秘游戏机 太上执符 斗罗,我霍雨浩,开局拒绝天梦 医生:从心动开始 我和大明星闪婚的日子 好像就我没重生啊 人在斗罗,武魂亚托克斯 苟在游戏开服前一百年

第152章 伊芙·卡莉的困惑(续)

也正是因为上述原因,无论是哪个时空。

世界上很多国家都在对文本探索。

人类社会记录方式的进步,某种程度上就集中表现在文本的不同凝练形式上。

文本的探索,对于一些大型企业来说,也是一项极为重要的工作。

涉及到文本摘要的发展,决定着一项又一项的产品的问世。

对于文本的探索,不仅仅对文学的深入研究有着很高的促进性,同样对于科技的推进有着巨大的促进作用。

总而言之,对文本摘要倾注些心血不过分。

毕竟这是林灰在技术领域方面迈出的第一步。

说到伊芙·卡莉遇到的困惑。

林灰没想到伊芙·卡莉的困惑主要集中在lh文本摘要准确度衡量模型的构建上。

林灰记得当时他关于这个模型构建已经阐述的够清楚的了。

构建模型的话首先要运用语言模型来评估算法生成语言的流畅度,然后使用相似度模型评估文本和摘要之间的语义相关性,最后为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。

虽然为了避免教会徒弟饿死师傅,林灰在这几个步骤之间故意遗漏了一些琐屑的步骤。

不过这种东西对于科研工作者来说,就像堑壕之于坦克。

虽然会有一些影响,但问题应该不大。

真的把所有的技术细节全部公布出来。

那也不能叫做公布技术路线了,那叫编教科书。

对于林灰提到的“运用语言模型来评估算法生成语言的流畅度”

伊芙·卡莉比较困惑林灰是怎么搞定语言模型训练的语料库的?

这个问题往后几年的话还真不是问题。

因为现成的语料库就一大堆。

仅仅是简体中文方面的语料库就有国家语委现代汉语语料库、京大语料库、语料库语言学在线等若干资源。

本章未完,点击下一页继续阅读。

目录
新书推荐: 华娱:满级导演但歌手出道 神明游戏:求生从破洞小木屋开始 深夜沉溺 恶爹休母卖女,我携娘归田成首富 挺孕肚进京离婚,军长低头轻声哄 结婚就出国,提离婚他却失控了 婚后六年,我离婚了 坐月子时你不在,我带娃离婚你哭什么 前夫兼兆两房,我嫁帝王登凤位 重生七零,悍妻当家
返回顶部