云启资本陈昱对话MSRA院友初敏:从科研到业界的思考与转变

  


12月9日,由MSRA院友会主办、院友会秘书长李世鹏,副秘书长马歆支持的,云启资本承办的以“技术创业正当时”为主题的MSRA院友闭门交流会顺利举行。思必驰副总裁、北京研发院院长初敏(Speech-E1)、数人科技CEO王璞(WSM-I3)、DataVisor中国区总经理吴中(VC-I3)、鲸准CEO胡健(ML-E3)、深动科技CEO蔡锐(WSM-E3)、智能一点CEO胡云华(WSM-E3)以及云启资本执行董事陈昱等嘉宾,为在场的“MSRA院友”分享了他们创业路上的故事。

 

在与云启资本执行董事陈昱的深度对话中,初敏表示,从科研到业界每一个转变都有不同收获,现在希望更专注在语音领域,未来5-10年还有很多工作要做。

 

以下为云启资本陈昱与初敏的对话实录,由云启资本精编整理,有删减:

 

主持人陈昱:大家好,我是云启资本的陈昱,云启是一家专注早中期技术投资的基金。我们已经参与投资了包括PingCAP、酷家乐、数人科技、擎朗智能等有MSRA院友的创业项目。今天很开心能够与初敏老师对话,先请初老师简单做一个自我介绍。

 

初敏:我2000年初进入到微软中国研究院,那时还不叫MSRA,叫MSRCN。当时国内有两家外企成立了研究院,另外一家是英特尔,我当时99年先去了英特尔的研究院做语音识别合成,做了一年后发现在硬件公司做软件方向研究很难,后来就找了开复到了MSRA。

 

微软中国研究院一开始就有大量有名的人跑过来,当年招的第一批博士是最幸运的,会有很多公司或者产业里的大牛来和他们一对一交流,今天他们也在学术界取得了非常大的成就。MSRA从一开始组建基调就非常高,找的人素质很好,各方面标准都非常高,在里面待几年收获非常大,即使只做个intern也感受很深,眼界会开拓很多。相比当时很多国外公司的研究院,微软研究院内部很开放,可以访问各种资源和资料。MSRA的环境、人的标准、眼界一直都维持在一个高标准,这一段经历我想在坐的大家很多也有同样感受,在MSRA待过对自己的职业生涯、经历都很是重要的一段熏陶和推动。

 

主持人陈昱:那后来什么样的契机促使您从微软到了阿里?

 

初敏:主要有两个原因,一方面是因为我一直做语音研究,到后来每年主要就是参加几个学术会议、TechFest等几件事,工作开始变得周而复始,缺乏兴奋感了,另一方面很好奇外面世界的变化,做研究的人生未来已经基本看得到,若不动,人的惰性会越来越大,变得更不想动。08年的时候王坚去了阿里,我才开始关注这家公司。当时没有想太多,核心就是不动是可预知,动是未知,但结果是好是坏不知道,因此就选择动了。动了以后,确实和自己预期是蛮不一样的,回过头看,MSRA真是一个很好很单纯的环境,大家都为了研究而努力。

 

主持人陈昱:到了阿里自己做的研究会更容易落地么?

 

初敏:最大的感受并不是是否落地。刚去阿里的前几年对我改变很大,我过去在MSRA看的都是高精尖,到了阿里发现很多事有不一样的做法。我去的时候阿里的技术还比较薄弱,但最让人不可思议的是大家能把业务发展的非常快,这对我是一个很大的冲击。阿里不是靠技术起家,靠的商业和运营思路。阿里当时还没有像现在这样找比较厉害的技术强人,觉得技术够用就行,但就是在这样的条件下实现了非常快的增长,非常厉害。在阿里内部推动事情的方法很不一样,要做成一件事,需要协调的事情和人很多,变化快,需要人有很强的适应变化的能力。阿里对我的影响很大,我现在做很多事情不仅仅是看技术本身,还会去看商业和技术的关系。

 

主持人陈昱:就是认识到了技术以外还有很多很重要的事情。

 

初敏:是的,而且是非常重要的,阿里很多初期项目是先依靠人进行商业验证,商业验证以后技术才慢慢跟上的,思路启发性很大。

 

主持人陈昱:到思必驰之后又有什么不同呢?

 

初敏:在阿里时像一个战斗部队一样,根据公司的战略要求不断调整自己的工作方向来作战,后来我更想坚持和持续的去做一些我感兴趣的语音相关工作,思必驰虽然没有阿里大,但它在这方面更专注,我在阿里庞大资源体系里时看到的东西更广泛,但我现在的工作更专注,在同一件事上能投入的精力更多。

 

主持人陈昱:语音这方面的工作还能做10年么?

 

初敏:这要看怎么定义语音,早期我们做语音,主要就是语音识别,语音合成等狭义的语音技术。今天我们大家说到语音时,其实是泛语音概念,包括这个语音交互的过程:要识别出来,要理解,要对话,要有恰当的应答或操作。对于泛语音,我是坚信未来3-5年会开始大规模的商业化的。语音技术的研究做了很多年,也在一些领域有应用,但到目前为止还没有真正大规模的商业化。今天的智能音箱是一种尝试,但音箱是不是最好的应用场景,还有待验证。单靠智能音箱是不能支撑一个产业的。只有将语音交互能力用到各行各业的很多场景中,才能说形成了产业,达到了商业化的目标。今天我们还在起步阶段,要想大规模商业化,绝不能简单着眼于追求语音识别率的提升,更需要将语音交互技术做成可大规模复制和应用的工具,并在很多场景里成功落地,这是我们未来几年最需要大力投入的方向,在未来5-10年中,还有很多工作要做。

 

主持人陈昱:如果您今天才入行,您会如何选择您的职业路径?

 

初敏:这个取决于我选择时的状态,如果我对研究很有兴趣,加入MSRA是最好的,会对自己的能力、眼界有很大的提升,如果我真的对产品很有热情,创业也许也是选择。

 

但我真的不建议每个人都去创业,创业真的很辛苦,是否能熬过创业开始的时间很关键,我见过很多好的创业者对他们做的事情很有热情,就是要把事情做成,熬过很多困难,不会放弃,如果你没有这些品质,没想清楚,去一些大型的企业做一些基本的训练会更好一些。

分享到: