首页 > 其他类型 > 重生2012：全球科技财阀 > 第9章训练

第9章训练（1/2）

好书推荐：重生美利坚：从农场主到商业帝王权力巅峰：从老乾局开始火速提拔娘娘留步！镇世督公从洛克王国回来的训练家港片：拒当卧底，警察的首富之路从凡武到星海重回96当巨头：从娱乐圈开始三国：大魏无双谋圣领主：从地坑院开始人在东京，影帝逆袭系统什么鬼

冬雪消融，柳枝吐新。但深视科技的研发中心內，气氛却比寒冬还要凝重。

过去的一段时间，公司进入了战时状態。

京城总部的灯光经常彻夜不熄，而在遥远的星城，一场规模浩大的人肉数据採集战役也正在进行。

为了採集足够多的真实人脸样本，星城分部的招了几个地推团队几乎跑遍了当地的大学、社区和商场。

他们拿著小礼品，请求路人录入人脸信息。

“麻烦眨眨眼”

“请向左转头”

“光线稍微亮一点”

人脸图片也是快速增长：几百张，几千张，几万张。

这是一场用人力堆出来的结果。

“只有90.2%。”

会议室里，顾书瑶看著大屏幕上的测试结果，声音里透著难以掩饰的疲惫和沮丧。

这是他们训练出的第一版深度学习模型（demo）。

虽然相比传统算法85%左右的识別率，这已经是巨大的飞跃，但在人眼识別率：97.53%面前，它依然是个脸盲。

“我们离人眼標准还差得远。”顾书瑶摘下眼镜，揉了揉满是红血丝的眼睛。

会议桌旁，汤小鸥教授、徐力、杨樊等人都在，连在微软研究院的何鎧明时不时的过来凑热闹也不说话了。

大家面前都摆著厚厚的测试报告，空气压抑得让人透不过气。

陈阳坐在主位，手里转著一支笔，神色平静。

其实他心里很清楚问题出在哪里。

前世deepid算法之所以能屠榜，靠的不是单一模型，而是模型融合（和多尺度特徵提取。

但他没有立刻说。

一个团队的战斗力，是在一次次撞墙和突围中磨练出来的。

如果每次遇到问题他都直接给答案，那这群天才终將变成只会执行命令的庸才。

他需要给他们一点时间，去试错，去思考。

“大家怎么看？”陈阳打破了沉默。

“目前我们的方案是標准的cnn（卷积神经网络）思路。”徐力指著架构图分析道，

“將整张人脸丟进模型，经过卷积层提取特徵，最后生成一个特徵向量进行对比。”

“但这有个问题，模型似乎抓不住细节。比如双胞胎，或者长得像的人，它很容易搞混。”

“我觉得还是数据量的问题。”汤小鸥教授沉吟片刻，给出了学术界的经典判断，

“深度学习是吃数据的。相较於imagenet动輒上千万张图，我们才几万张，模型根本吃不饱，泛化能力自然上不去。”

“我建议，扩大数据集。”

汤小鸥看向陈阳：“把数据量翻倍，甚至翻四倍。只有见过足够多的人，模型才能学会什么是不同。”

“同意。”

“附议。”

大家都觉得这是目前最靠谱的路径。

“好。”

陈阳点了点头，虽然他知道这会有提升，但不会有质变，但他还是支持团队的决定，

陈阳找来林小月叮嘱道：“通知星城那边，加大投入。我要5000个人的样本，至少20万张照片。”

“好的。”

又是半个月的煎熬。

星城团队像是上了发条一样，终於凑齐了这20万张高质量的人脸数据。

数据传回京城，新一轮的训练开始了。

这时候，算力的瓶颈赤裸裸地暴露了出来。

由於超算中心还在建设中，他们只能用现有的十几台伺服器跑任务。

进度条走得慢如蜗牛。

一天，两天直到第十二天，模型才终於收敛（训练完成）。

“这太慢了。”

顾书瑶看著伺服器风扇轰鸣，却依然缓慢的进度条，急得嘴角冒泡，

“一次叠代要十几天，如果有bug重跑又要十几天。这简直是在浪费生命。”

陈阳站在机房外，看著这一幕，建立超算中心的想法从未如此迫切。

在ai时代，时间就是金钱，算力就是生命。

等到算力中心建设完成，这个时间將被压缩到几个小时。

但现在，他们只能等。

第十三天，结果出来了。

91.3%。

仅仅提升了1.1%。

看著这个数字，顾书瑶差点把键盘砸了。

付出了两倍的人力，十几天的时间，就换来这一丁点的提升？

按照这个速度，想超过人眼识別率，得等到猴年马月？

本章未完，点击下一页继续阅读。

新书推荐：斗罗：以真理之名，超越往昔影视诸天：从四合院开始同穿地狱开局：但天赋百倍叠加咒回：魔虚萝不想成为弱者思维全职法师：我在魔法世界亦正亦邪快穿：恶毒女配她被男主给缠上了哥哥，喜欢我不好吗财阀继承人的古董女友高武：开局签到武圣巅峰修为神级顏值系统？可我本就是神顏！

第9章 训练（1/2）

第9章训练（1/2）