首页 > 都市言情 > 穿越:2014 > 第297章 科學技術進步獎提名(2)

第297章 科學技術進步獎提名(2)(1/2)

目录
好书推荐: 读弟弟笔记,姐姐直播中练成雷法 人在斗破:开局觉醒酒剑仙系统 魔卡时代,我带着神秘游戏机 太上执符 斗罗,我霍雨浩,开局拒绝天梦 医生:从心动开始 我和大明星闪婚的日子 好像就我没重生啊 人在斗罗,武魂亚托克斯 苟在游戏开服前一百年

第297章 科學技術進步獎提名(2)

某种程度上而言,子专利是母专利在细分的专业应用领域的具体阐述。

子专利非但不弱于母专利,反倒在一些细分领域往往能够青出于蓝而胜于蓝。

而林灰搞得“一种新型的汉语言文本处理方式”这个专利来说。

这个专利所采用的核心算法依然是生成式摘要摘要算法。

但该专利着重强化了生成式摘要算法对于汉语的处理能力。

事实上生成式文本摘要相对于抽取式摘要在处理汉语言方面的摘要本就技高一筹。

而现在“一种新型的汉语言文本处理方式”更上一层楼。

那么该技术在汉语言能力方面的处理水平可见一斑。

文本摘要生成和总结是因为数据爆炸而连带着兴起的科研技术难题。

随着数据的爆炸性产生,特别是文本数据,人们已经无法及时浏览和理解所有感兴趣的相关文本。

遗漏重要的文本信息又会造成很多组织和应用的损失。

因此文本摘要自动归纳总结是实际应用中非常需要的应用面非常广的一项技术。

在林灰生成式摘要算法问世之前。

大部分中文文章摘要自动产生工具的工作方式实际上依然是在利用抽取式摘要算法。

这种比较古板的摘要算法依然是进行关键字式的片段提取从而形成文章总结或摘要。

这种方法并不高明,其核心工作原理仍然是要寻找文章中的关键字。

然后选取含有关键字较多的句子形成摘要。

这样的方法对文章缺乏整体的理解。

摘要中的句子之间没有很好的自然衔接。

这是因为这些方法都没有真正的理解文章用自己理解后的语言组织成摘要。

从纯粹技术角度出发,此前的抽取式摘要的主要步骤依然是:

将原文本拆分为句子,在每个句子中过滤掉停用词,并只保留指定词性的单词。

由此得到句子的集合和单词的集合。

在此基础上进一步处理,以无序无向图的思路来搞。

计算每个单词节点的重要性。

根据计算的结果以最重要的若干单词作为关键词。

接着是关键短语提取。

最后是摘要的生成。

这些传统方法通常默认将机器认为重要的句子组合成摘要。

其主要缺点是不能概括全文,没有真正的理解文章用自己理解后的语言组织成摘要。

除以上缺点之外,目前主流的文本摘要方法都有人为特征定制和提取的工作。

而林灰搞得这项技术则完全不是这样(具体慢慢展开吧,感兴趣的可以过段时间刷新下看看这)。

甚至林灰觉得他搞得这项技术甚至有可能是开创了国内多项领域研究的空白。

比如说在汉语言文本摘要情感分析这方面。

除此之外还有很多方面。

总而言之,这样的专利自然是有实力角逐科学技术进步奖二等奖的。

而且林灰这种情况客观来说也符合相应的条例。

按照相应的条例:

“国家科学技术进步奖授予在应用推广先进科学技术成果、完成重大科学技术工程、计划、项目等方面做出突出贡献的下列公民、组织,其中包括:

在实施技术开发项目中,完成重大科学技术创新、科学技术成果转化,创造显著经济效益的;

在实施社会公益项目中,长期从事科学技术基础性工作和社会公益性科学技术事业,经过实践检验,创造显著社会效益的;

在实施国家安全项目中,为推进国防现代化建设、保障国家安全做出重大科学技术贡献的;

本章未完,点击下一页继续阅读。

目录
新书推荐: 娱乐:粤圈时代 恋爱至上主义世界的白莲花 华娱:都重生了,谁还当演员啊 从错误面板开始无限加点 笨蛋美人当团宠,师兄们抢疯了! 幻想文豪1860 闪婚禁欲特助,傅总轻点宠 战锤:继承海军上将开始整顿泰拉 小兕子来我家当团宠,李世民急了 少儿频道也算道?
返回顶部