第9章 训练(2/2)
“单纯堆数据,边际效应递减了,看来方向不对。”汤小鸥看著数据,眉头紧锁。
“要不试试传统算法和深度学习结合?”汤小鸥提议,
“用传统算法做对齐,用深度学习提特徵?”
“试!”顾书瑶觉得这也是一个办法。
又是几天的折腾,失败。
效果甚至还不如纯深度学习。
“再加数据?”徐力咬著牙提议,“加到100万张!我就不信餵不饱它!”
“来不及了。”顾书瑶摇摇头,看了一眼日历,
“投资人希望三个月看到阶段性成果。收集100万张照片至少要半年,我们等不起。”
会议室里再次陷入了死寂。
这一次,连汤小鸥也没辙了。
学术界目前最先进的方法都在这儿了,还能怎么办?
陈阳看著大家垂头丧气的样子,知道火候到了。
挫折教育已经足够,现在是时候注入信心了。
“大家是不是走进了一个误区?”
陈阳的声音突然响起,清朗有力,瞬间吸引了所有人的目光。
他站起身,走到白板前,画了一张人脸的简笔画。
“我们现在是把整张脸丟进去,让模型自己去学。但是,人脸是复杂的。”
陈阳用笔在人脸的眼睛、鼻子、嘴巴上分別画了圈。
“如果我是警察抓小偷,我不仅会看他的脸型,还会特意看他的眼睛大不大,鼻子挺不挺,嘴唇厚不厚。”
陈阳转过身,看著汤小鸥和徐力,拋出了那个关键的提示:
“我们为什么不把人脸切开呢?”
“切开?”徐力一愣。
“对。”陈阳在白板上画了几个方框,
“全脸是一个输入。眼睛区域是一个输入,鼻子是一个,嘴巴是一个。甚至,我们可以在不同的尺度上切,有的切大点,有的切小点。”
“每一个区域,我们都训练一个独立的模型去识別特徵。”
陈阳在画板上重重一笔,將所有方框连向一个终点,
“最后,我们將这些所有模型提取出来的特徵,拼接在一起。”
“这就是:联合决策。”
轰!就像是一道闪电划过夜空。
汤小鸥猛地站了起来,眼睛死死盯著白板上的图,嘴里喃喃自语:
“局部特徵、多尺度、模型融合。对啊!我怎么没想到!这样能强迫模型关注细节,让同一个人的向量更聚合,不同人的向量拉得更开!”
“这能极大提升泛化能力!”徐力也激动得跳了起来:“陈总,这招太绝了!”
“可是。”
顾书瑶作为工程负责人,第一时间想到了代价,“如果把人脸切成几十块,每一块都用一个网络,那计算量。”
“这就是暴力美学。”
汤小欧教授笑了:“我们现在缺算法,缺数据,但就是不缺暴力的决心。一个模型不行,我们就上十个;十个不行,就上六十个!”
“把人脸切成10个区域,每个区域在rgb和灰度图上各训练3个网络。一共60个卷积神经网络!”
“我要用这60个模型,像60个拿著放大镜的侦探一样,把人脸的每一个毛孔都看清楚!”
“60个模型。”大家被这个疯狂的数字震住了。
在2013年,训练一个深层网络已经是大工程,同时跑60个?这简直是疯子的想法。
但正是这种疯狂,让在场的每一个人都热血沸腾起来。
“就这么干!这才是ai该有的样子!大力出奇蹟!”
汤小鸥一拍桌子,眼中闪烁著赌徒般的狂热。
“书瑶,调动所有伺服器资源!不够在继续买。”
“徐力,杨樊,你们负责切图和网络结构设计!”
“今晚不睡了,我们要搞个大新闻!”
整个研发中心瞬间沸腾了。
原本沉闷的气氛一扫而空,取而代之的是一种决战前的亢奋。
代码飞快地在屏幕上滚动。
人脸图片被切割成眼睛、鼻子、嘴巴等各种碎片。
60个独立的神经网络像60头飢饿的野兽,被塞进了有限的显存里。
陈阳站在后方,看著这一幕。
他知道,这就是著名的deepid算法的核心思想。
虽然现在超算中心还没建好,训练这60个模型会非常痛苦,可能需要轮流跑。
但只要这条路是对的,胜利只是时间问题。
屏幕上,新的训练任务已经启动。
进度条再次开始缓慢爬升。
这一次,所有人的心里充满了期待。