首页 > 其他类型 > 重生2012:全球科技财阀 > 第9章 训练

第9章 训练(1/2)

目录
好书推荐: 重生美利坚:从农场主到商业帝王 权力巅峰:从老乾局开始火速提拔 娘娘留步!镇世督公 从洛克王国回来的训练家 港片:拒当卧底,警察的首富之路 从凡武到星海 重回96当巨头:从娱乐圈开始 三国:大魏无双谋圣 领主:从地坑院开始 人在东京,影帝逆袭系统什么鬼

冬雪消融,柳枝吐新。但深视科技的研发中心內,气氛却比寒冬还要凝重。

过去的一段时间,公司进入了战时状態。

京城总部的灯光经常彻夜不熄,而在遥远的星城,一场规模浩大的人肉数据採集战役也正在进行。

为了採集足够多的真实人脸样本,星城分部的招了几个地推团队几乎跑遍了当地的大学、社区和商场。

他们拿著小礼品,请求路人录入人脸信息。

“麻烦眨眨眼”

“请向左转头”

“光线稍微亮一点”

人脸图片也是快速增长:几百张,几千张,几万张。

这是一场用人力堆出来的结果。

“只有90.2%。”

会议室里,顾书瑶看著大屏幕上的测试结果,声音里透著难以掩饰的疲惫和沮丧。

这是他们训练出的第一版深度学习模型(demo)。

虽然相比传统算法85%左右的识別率,这已经是巨大的飞跃,但在人眼识別率:97.53%面前,它依然是个脸盲。

“我们离人眼標准还差得远。”顾书瑶摘下眼镜,揉了揉满是红血丝的眼睛。

会议桌旁,汤小鸥教授、徐力、杨樊等人都在,连在微软研究院的何鎧明时不时的过来凑热闹也不说话了。

大家面前都摆著厚厚的测试报告,空气压抑得让人透不过气。

陈阳坐在主位,手里转著一支笔,神色平静。

其实他心里很清楚问题出在哪里。

前世deepid算法之所以能屠榜,靠的不是单一模型,而是模型融合(和多尺度特徵提取。

但他没有立刻说。

一个团队的战斗力,是在一次次撞墙和突围中磨练出来的。

如果每次遇到问题他都直接给答案,那这群天才终將变成只会执行命令的庸才。

他需要给他们一点时间,去试错,去思考。

“大家怎么看?”陈阳打破了沉默。

“目前我们的方案是標准的cnn(卷积神经网络)思路。”徐力指著架构图分析道,

“將整张人脸丟进模型,经过卷积层提取特徵,最后生成一个特徵向量进行对比。”

“但这有个问题,模型似乎抓不住细节。比如双胞胎,或者长得像的人,它很容易搞混。”

“我觉得还是数据量的问题。”汤小鸥教授沉吟片刻,给出了学术界的经典判断,

“深度学习是吃数据的。相较於imagenet动輒上千万张图,我们才几万张,模型根本吃不饱,泛化能力自然上不去。”

“我建议,扩大数据集。”

汤小鸥看向陈阳:“把数据量翻倍,甚至翻四倍。只有见过足够多的人,模型才能学会什么是不同。”

“同意。”

“附议。”

大家都觉得这是目前最靠谱的路径。

“好。”

陈阳点了点头,虽然他知道这会有提升,但不会有质变,但他还是支持团队的决定,

陈阳找来林小月叮嘱道:“通知星城那边,加大投入。我要5000个人的样本,至少20万张照片。”

“好的。”

又是半个月的煎熬。

星城团队像是上了发条一样,终於凑齐了这20万张高质量的人脸数据。

数据传回京城,新一轮的训练开始了。

这时候,算力的瓶颈赤裸裸地暴露了出来。

由於超算中心还在建设中,他们只能用现有的十几台伺服器跑任务。

进度条走得慢如蜗牛。

一天,两天直到第十二天,模型才终於收敛(训练完成)。

“这太慢了。”

顾书瑶看著伺服器风扇轰鸣,却依然缓慢的进度条,急得嘴角冒泡,

“一次叠代要十几天,如果有bug重跑又要十几天。这简直是在浪费生命。”

陈阳站在机房外,看著这一幕,建立超算中心的想法从未如此迫切。

在ai时代,时间就是金钱,算力就是生命。

等到算力中心建设完成,这个时间將被压缩到几个小时。

但现在,他们只能等。

第十三天,结果出来了。

91.3%。

仅仅提升了1.1%。

看著这个数字,顾书瑶差点把键盘砸了。

付出了两倍的人力,十几天的时间,就换来这一丁点的提升?

按照这个速度,想超过人眼识別率,得等到猴年马月?

本章未完,点击下一页继续阅读。

目录
新书推荐: 二战:从打崩沙漠之狐开始 我在庙街练神功 我在恐怖世界训练蝙蝠侠 晋忠 重回97,缔造新人生 天后们的緋闻教父 刚上高中,绑定自律系统 不可证伪的月光 倒反天罡:从职场打脸开始 苟在异界学巫术
返回顶部