AI大热。
相比于算法的进步,人工智能在产品化和商业化层面还稍显滞后。
当下人工智能更多以To B的产品形态存在,而消费级产品虽在很早以前便充斥于市场中,但欠佳的用户体验与较慢的用户接受度,使其直至现在仍旧难以进入主流。
相比而言,手机是一款普及度和使用频率均非常高的消费级产品,与此同时,手机每天也可产生无数连续性的用户操作数据和传感器采集数据。因此,手机这一终端无疑是AI的最佳载体之一。
然而,虽然AI在手机端大有可为,但现阶段依旧存在不少问题。
1、语音交互系统之殇
多年来,不少手机厂商多次尝试在手机内置入语音助手,其中Siri是用户最为熟知的一个。Siri至今已推出6年时间,经过这么多年的不断打磨和优化,表现并不能让用户满意。
不止是Siri,其实无论是侧重于闲聊的Chatbot,还是侧重于任务处理的虚拟助理,在现阶段仍然不成熟。
主要由于两大原因:一是时机未到,其次技术(主要是NLP自然语言处理)还有很长的路要走。
①时机未到
时机未到,主要包括用户尚未养成用使用语音交互的习惯,此外整个市场也处于培育阶段。
科大讯飞执行总裁胡郁曾指出,2014年科大讯飞与一手机巨头签署战略合作,把语音交互技术应用在他们的手机产品中。直到2017年,科大讯飞仍旧觉得语音交互系统在手机产品中的应用时机未到,并不能排在最前面。
“根据经验,语音交互系统植入在硬件产品中的优先级:首先是电视、机顶盒和冰箱,再到手机、机器人,最后才是VR。”胡郁谈到。
②技术难以突破
NLP是语音交互系统的核心技术,然而中国科学院智能技术研究专家张钹院士曾指出目前NLP难以突破人工智能,主要原因是难以突破确定性、完全的知识和信息,以及封闭化和特定化问题的三大基本限制条件。
张钹院士用一个例子指出当下NLP中的问题“一年以前,如果我和微软小冰聊天。我说我叫张钹,小冰就会傻眼了。因为它的语料库里没有我的信息。我如果说我是章子怡,小冰就应该可以聊下去。”
2、手机AI芯片:看似前沿,实则应用场景有限
鉴于英伟达、赛灵思的GPU、FPGA在AI市场上的优秀表现,很多人认为,手机AI芯片的时代也要到来。
近期,华为发布了手机专用AI芯片:麒麟970。
根据官方介绍,麒麟970在人脸识别、图像处理和语音方面获得前所未有的能力,提升手机应用体验的丰富性和效率。
这里笔者有个疑问,手机有必要用AI芯片吗?
如华为官方所言,AI芯片更多是提高语音和图像在本地的处理能力。但大规模的计算任务完全可以在云端完成,只有非常少的场景,才需要在本地处理。
哪些需要本地处理?
以我们熟知的图片处理软件Prisma为例,它能够过人工智能把你手机中那些普通的照片模仿出著名艺术家画作的风格。
几乎所有用户都抱怨Prisma处理图像等待的时间过久,主要因为图像处理放在服务器和云端处理时间较长,但放在本地则面临手机芯片吃不消的问题,一旦吃不消又会导致处理时间延长。
之后Prisma虽然实现了手机本地计算,通过大量优化显著降低了模型的复杂度(这样做的负面影响导致效果变差),但对于手机CPU来说仍然负荷很大,速度仍然比较缓慢,部分风格滤镜需要计算10秒以上才能完成图片转换。
因此,类似Prisma这种复杂的场景,才往往需要手机专用AI芯片。
我们可以看到,麒麟970的主要作用是让手机自身拥有承载深度神经网络的强大计算力,让Prisma等这类需要跑在深度神经网络上的应用提升体验。
但实际上绝大多数应用没必要用深度网络加速芯片去加速,一方面普通的手机芯片也可承载大多任务,另一方面,复杂的任务云端也可保质保量地解决。
目前智能手机上需要用到AI芯片去加速的应用并没有很多。虽然未来会有发挥的潜力,但现阶段应用场景十分有限。
3、什么AI功能才是手机的刚需?
在人工智能主流环境下,人们更多崇尚“算法为王”。但不少业内人士们持有一个观点:消费级AI领域里,一个好的产品经理要比一个优秀的算法工程师更重要。
由于消费级产品的独特性,算法突破落地到终端产品当中,其效果提升往往非常有限,相比而言,把握好产品体验、抓准用户需求会更有意义。
苹果历来在人工智能的宣传上比较低调,但其实他们利用AI在增强用户体验方面有着不少探索。
苹果相关负责人曾谈到,人工智能已经在为iPhone用户带来不少体验上的提升:如识别陌生来电、Apple store使用深度学习辨别骗保行为,在解锁后列出你最常使用的应用、事项提醒,以及自动显示附近标记的酒店等,这些看似不起眼、但很实用的功能在苹果全面拥抱机器学习及神经网络后,让用户的操作体验越来越完美。
这些隐藏在iPhone中的AI便是“Apple Brain”,苹果大脑已经完全内置于iPhone中。
从纯技术角度讲,要想实现上述功能,确实无需采用非常前沿的算法。但“实现”和“好用”这两个结果有着质的差别,要让终端用户满意,这背后除了算法本身外,还有很多要考虑的因素。
AI研究者都知道,要让机器学习模型的鲁棒性强健,简单地拿大量计算资源、用高级算法对大量数据进行粗暴式分析是行不通的,不仅造成计算资源的大量浪费,同时也容易出错误。这个时候,首先需要根据不同机型传感器的特性、不同应用的特性、不同用户的特性,做很多规则的制定与定义。这块看不见的工程其实非常复杂且繁琐,同时也正是保证AI功能体验优秀的前提。
这里以与“Apple Brian”相似的国内人工智能引擎“One Mind”为例,它是魅族Flyme自主研发的人工智能系统服务,具备分析、决策、进化学习的能力。
其中“进程收割者”功能会对每个App的实时动态特征、唤醒方式、内存占用等方面进行审查,一旦发现有行为异常的应用,如占用大量资源、后台强制唤醒等,则会对其进行清理。
在One Mind此前,行业内绝大部分安卓系统采用“圈定白名单应用”这种一刀切的方式去定义。 但对于不在白名单内,却是用户需要用到的APP,除非主动添加,否则便面临被误杀的问题。
语音识别出现错误用户可忍受,滤镜处理速度慢用户也可忍受,但有些应用明明在正常工作,却被当做是异常行为被关掉,这对用户体验的体验影响是极其巨大的。
因此在做好AI功能之前,“进程收割者”首先要解决一大问题:如何定义“正常工作”?
Flyme团队花了大量时间去重新定义“应用工作”这件事,在制定好规则后,利用机器学习算法在规则体系下对用户的行为进行学习、对后台的应用动态进行分析,据悉现阶段,应用识别准确率可达到99.5%。
目前,整个人工智能与手机操作系统的结合才刚刚开始,相信未来 One Mind 会拥有更强大的场景分析能力和行为习惯的学习预测能力。Flyme负责人杨颜也公开表示:“现在的One Mind就像一个推开了新世界大门的孩子,它看到了不只是一束光,更是未来无限的可能。”
其实无论是苹果的“Apple Brain”还是魅族Flyme的“One Mind”,都印证了苹果高级副总裁Schiller的一句话:人工智能的目的,是让用户在不知不觉中得到AI带来的体验提升,用户甚至都感觉不到它的存在,直到有一天才突然意识到,并发出感叹:这一切到底怎么发生的?”
人工智能之于手机,并非阳春白雪,那些无需用户刻意学习、持续提升用户体验、让手机尽可能帮助用户主动做正确决策的功能,才是手机人工智能的真需求。