第9章 训练(1/2)
冬雪消融,柳枝吐新。但深视科技的研发中心內,气氛却比寒冬还要凝重。
过去的一段时间,公司进入了战时状態。
京城总部的灯光经常彻夜不熄,而在遥远的星城,一场规模浩大的人肉数据採集战役也正在进行。
为了採集足够多的真实人脸样本,星城分部的招了几个地推团队几乎跑遍了当地的大学、社区和商场。
他们拿著小礼品,请求路人录入人脸信息。
“麻烦眨眨眼”
“请向左转头”
“光线稍微亮一点”
人脸图片也是快速增长:几百张,几千张,几万张。
这是一场用人力堆出来的结果。
“只有90.2%。”
会议室里,顾书瑶看著大屏幕上的测试结果,声音里透著难以掩饰的疲惫和沮丧。
这是他们训练出的第一版深度学习模型(demo)。
虽然相比传统算法85%左右的识別率,这已经是巨大的飞跃,但在人眼识別率:97.53%面前,它依然是个脸盲。
“我们离人眼標准还差得远。”顾书瑶摘下眼镜,揉了揉满是红血丝的眼睛。
会议桌旁,汤小鸥教授、徐力、杨樊等人都在,连在微软研究院的何鎧明时不时的过来凑热闹也不说话了。
大家面前都摆著厚厚的测试报告,空气压抑得让人透不过气。
陈阳坐在主位,手里转著一支笔,神色平静。
其实他心里很清楚问题出在哪里。
前世deepid算法之所以能屠榜,靠的不是单一模型,而是模型融合(和多尺度特徵提取。
但他没有立刻说。
一个团队的战斗力,是在一次次撞墙和突围中磨练出来的。
如果每次遇到问题他都直接给答案,那这群天才终將变成只会执行命令的庸才。
他需要给他们一点时间,去试错,去思考。
“大家怎么看?”陈阳打破了沉默。
“目前我们的方案是標准的cnn(卷积神经网络)思路。”徐力指著架构图分析道,
“將整张人脸丟进模型,经过卷积层提取特徵,最后生成一个特徵向量进行对比。”
“但这有个问题,模型似乎抓不住细节。比如双胞胎,或者长得像的人,它很容易搞混。”
“我觉得还是数据量的问题。”汤小鸥教授沉吟片刻,给出了学术界的经典判断,
“深度学习是吃数据的。相较於imagenet动輒上千万张图,我们才几万张,模型根本吃不饱,泛化能力自然上不去。”
“我建议,扩大数据集。”
汤小鸥看向陈阳:“把数据量翻倍,甚至翻四倍。只有见过足够多的人,模型才能学会什么是不同。”
“同意。”
“附议。”
大家都觉得这是目前最靠谱的路径。
“好。”
陈阳点了点头,虽然他知道这会有提升,但不会有质变,但他还是支持团队的决定,
陈阳找来林小月叮嘱道:“通知星城那边,加大投入。我要5000个人的样本,至少20万张照片。”
“好的。”
又是半个月的煎熬。
星城团队像是上了发条一样,终於凑齐了这20万张高质量的人脸数据。
数据传回京城,新一轮的训练开始了。
这时候,算力的瓶颈赤裸裸地暴露了出来。
由於超算中心还在建设中,他们只能用现有的十几台伺服器跑任务。
进度条走得慢如蜗牛。
一天,两天直到第十二天,模型才终於收敛(训练完成)。
“这太慢了。”
顾书瑶看著伺服器风扇轰鸣,却依然缓慢的进度条,急得嘴角冒泡,
“一次叠代要十几天,如果有bug重跑又要十几天。这简直是在浪费生命。”
陈阳站在机房外,看著这一幕,建立超算中心的想法从未如此迫切。
在ai时代,时间就是金钱,算力就是生命。
等到算力中心建设完成,这个时间將被压缩到几个小时。
但现在,他们只能等。
第十三天,结果出来了。
91.3%。
仅仅提升了1.1%。
看著这个数字,顾书瑶差点把键盘砸了。
付出了两倍的人力,十几天的时间,就换来这一丁点的提升?
按照这个速度,想超过人眼识別率,得等到猴年马月?
本章未完,点击下一页继续阅读。