首页 > 娱乐前沿 > 产经
看富士通如何运用深度学习技术创新企业应用
小唯 2016-08-14 12:05:08

富士通运用深度学习技术开发的智慧监控应用,可即时分析监控视讯的画面,準确分辨出不同的车辆类型与行人。 ECR我酷网

图片来源:

iThomeECR我酷网

在我们生活周遭不乏深度学习的例子,例如电子邮件的垃圾信件过滤机制,又如Google相簿与Facebook相继推出的自动辨识功能。ECR我酷网

深度学习运用于企业的各种场景ECR我酷网

在Google相簿中,你不需要先为相片加上内容注解的标籤,Google相簿就会以深度学习技术辨识影像,找出符合条件的相片,只要输入「花」、「海」等字,Google相簿就会找出对应的相片。Facebook则能为你上传的人物照片自动加上用户名称,在你为特定人物的照片标识过几次用户名称之后,Facebook的程式就会学习辨识,认出照片中的人。ECR我酷网

除此之外,深度学习技术还能够如何运用在企业的业务场景呢?在今年日本富士通论坛上,一口气展示好几项人工智慧企业应用,涵盖金融业、製造业、零售业、服务业等多个产业的业务应用,这除了象徵人工智慧是富士通未来技术开发的一大主力方向,更可从中看出人工智慧应用于企业场景的可能性。ECR我酷网

富士通社长田中达也表示,他们自1980年代就开始研发人工智慧技术,至今已拥有超过百件技术专利,目前主流的研发技术是深度学习,因为其在影像辨识、语音处理方面有极佳的準确率,而这些技术都已经纳入富士通的人工智慧平台——Zinrai(迅雷)。ECR我酷网

富士通的Zinrai人工智慧架构,将学习技术与先进研究这两项主题,视为人工智慧平台的基石,其中包含三个关键的机器学习技术,分别是深度学习、强化学习(Reinforcement Learning)与相关的机器学习技术。而所谓的先进研究,则包含神经科学、模拟及社会接受度。ECR我酷网

在学习技术与先进研究的基础上,则是整合相关技术提供三大类人工智慧应用,包括感知与辨识、知识处理、决策支援,让企业能够从拥有感知能力起步,接着进展到能有行动力。ECR我酷网

要让企业组织拥有感知与辨识能力,富士通认为,要结合影像辨识、语音辨识及情感状态辨识,可用于防诈侦测、依据顾客反应自动调整服务等场景;要有知识处理能力,则需要自然语言处理技术、知识处理与探索、模式探索等技术,可用于医疗判断、金融顾问等业务;要提供让企业足以行动的决策与支援能力,则需要推理与规画、预测与最佳化、互动与推荐等技术的结合,例如应用于交通流量疏导。ECR我酷网

深度学习用于智慧城市影像监控ECR我酷网

从深度学习技术的演进可见,它是结合多种已经发展多年的技术而成,而上述人工智慧的应用架构也包含许多过往常见的技术名词,如影像辨识、语音辨识等等,但是,难道人工智慧只是新瓶装旧酒吗?对此,可以从富士通研发的新一代影像辨识应用找到答案。ECR我酷网

富士通运用深度学习的新一代智慧监控技术(Smart Survelliance),可以即时分析监控视讯画面,辨识出车辆的类型,如汽车、公车、摩托车,亦可辨别车辆的厂牌及颜色。在富士通论坛展示此项应用的技术,现场负责的人员表示,过往没有採用深度学习的影像辨识技术,必须由影像专家事先针对影像内容定义,个别定义出汽车、公车、摩托车等各种物体的辨识条件,再将这些条件写在程式裏,让程式拥有辨识物体的能力。然而,传统做法的问题在应用局限大,若是没有事先定义的物体,辨识软体就派不上用场了,也因此往往会有许多例外状况。ECR我酷网

深度学习的手法则是提供大量照片,让演算法去参照画面,透过程式反覆学习,而不需要特别的影像专家针对影像修正。以辨识车辆厂牌为例,富士通的研发人员会输入数万张同厂牌的车辆照片,让深度学习模型学会辨识该厂牌。该技术人员指出,以辨识Audi汽车为例,他们在资料库输入1万多张照片,大概花了3天,深度学习演算法就能辨识出Audi汽车。而且,深度学习技术的好处是,一旦认出Audi汽车,日后就算是不同颜色的Audi汽车,深度学习演算法都认得出来厂牌与颜色,不需要再调校。ECR我酷网

该技术人员表示,建立深度学习模型所需的时间与运算资源也有很大的关係,以上述提供1万多张Audi汽车照片,得以在3天内就能正确识别,需要用上2至3张GPU加速卡。当然,伺服器的运算规模越强大,则能缩短学习时间,此外,深度学习演算法需要平行运算架构及平行运算资料库。ECR我酷网

同时,富士通这项影像辨识技术除了辨识车辆,还可运用于停车场车位监控(Smart Parking),可即时掌握车位的停车状况。此外,也可以辨识行人的年纪、服装类型,例如西装、衬衫、裤子、裙子等等,以及服装颜色,可运用于快速追蹤老人或幼儿走失的问题。ECR我酷网

目前富士通的Smart Parking车位监控应用已经商品化,单一视讯监控影像可辨识100个停车位,在杜拜实际导入的成果,辨识率达到98%。至于Smart Survelliance的智慧监控应用,则可望在今年商品化。ECR我酷网

ECR我酷网

能区别多台汽车与路人富士通运用深度学习技术开发的智慧监控应用,可即时分析监控视讯的画面,準确分辨出不同的车辆类型与行人。ECR我酷网

ECR我酷网

自动辨识车辆的厂牌运用深度学习的手法,在输入上万张同一个厂牌的车辆照片,智慧监控系统就可以自动辨识该厂牌的车辆,不需要影像专家事先设定辨识条件。ECR我酷网

ECR我酷网

停车位自动辨识富士通的智慧监控技术亦可应用于停车场的车位辨识,可由单一摄影机的视讯影像,自动监控100个停车位的状况,準确率达98%。ECR我酷网

深度学习用于网路攻击侦测与鉴识ECR我酷网

富士通也将深度学习技术应用于资讯安全,这是由富士通研究所研发的技术——运用异数学习技术(Outlier Learning)的资安攻击检测。在场负责展示的富士通研究所人员表示,现今资讯安全面临最大的威胁就是未知的针对型攻击,这类型攻击往往躲藏在大量的攻击活动中,不仅是一般资安防护软体检验不出来,就算是从Log档分析,若缺乏有效的分析技术,只靠有限的人力,往往无法从大量的Log档资讯中,找到蜘丝马迹。ECR我酷网

然而,网路攻击即便是未知的手法,但也有其模式可辨别,只是依照人们过往的经验可能无法轻易识别,但若由训练过的深度学习演算法来识别攻击模式,应当会比人们来得可行。富士通研究所人员指出,他们研发的这项网路攻击检测技术,是採用非监督式(unsupervised)的深度学习技术,目前虽然尚未商品化,但已经运用在富士通全球的各个云端资料中心,而且,最近还因此发现一个未知的攻击行动。ECR我酷网

ECR我酷网

非监督式深度学习技术ECR我酷网

所谓的非监督式深度学习技术,是在无提供标籤内容的情况下,让演算法自动归纳模式,若将这种方法运用于检测未知网路攻击威胁时,特别有效。ECR我酷网

富士通研究所也为这个网路攻击检测技术,赋予一套既直觉又酷炫的视觉化介面,能将攻击行为分别呈现,将涉及的主机数量与连线以云状图呈现,如此除了藉由云状图的大小,可快速掌握攻击的规模,同时,一些如APT这类故意分散攻击的行为,也会被呈现出来。ECR我酷网

此外,富士通研究所也将相同的技术延伸至网路攻击鉴识,可以将攻击的路径、受攻击的网段、主机IP位址之间的连线关係,以即时视觉化图表呈现。ECR我酷网

ECR我酷网

以深度学习分析网路攻击ECR我酷网

经过分析归纳后,这套系统会将每个攻击活动以云状关联图呈现,即时反应攻击活动的範畴、频率,有助于管理者迅速掌握状况。ECR我酷网

ECR我酷网

强化资讯安全鉴识分析力ECR我酷网

网路活动记录经过分析归纳后,可再由资讯安全鉴识工具进一步分析,攻击活动的路径、主机与IP位址的关联,都能即时呈现。ECR我酷网

ECR我酷网

即时呈现攻击关连ECR我酷网

在这套资安鉴识工具上,除了提供即时互动仪表板,呈现网路攻击的过程,也提供整个事件的路径关係图。ECR我酷网

深度学习用于工厂管理ECR我酷网

现今智慧型手机用户早就习惯的语音助理,其实背后也是藉助于深度学习与自然语言处理技术。富士通也将此技术应用在工厂管理。ECR我酷网

在实际的展示中,一位工厂管理人员以平板开启数位助理程式,他以麦克风询问:「目前工厂的状况如何?」在程式解析其语意后,就连结工厂资讯系统并回报状况,几秒后数位语音助理回答:「滋贺工厂的A生产线有警示。」此时,平板萤幕也同步显示工厂的监控数据。接着,管理人员又再问:「告诉我A生产线的详细情形。」数位助理随即回答:「了解。 」然后,萤幕上呈现A生产线的几个监控数据图。于是,管理人员又再问:「请调查原因。」数位助理回覆:「感应器的感应下降了20%。」管理人员于是询问:「这个装置该如何处理?」而数位助理回答:「我需要分析过往的数据,请稍等。」过了几秒钟,数位助理回答:「建议儘快更换感应器。」ECR我酷网

在上述的应用情境下,人工智慧不仅具有监控的功能,同时还提供知识处理,以及建议行动的能力。ECR我酷网

深度学习用于金融防诈与客户服务ECR我酷网

自然语言处理技术也可运用在防範金融诈欺,不过,富士通除了将深度学习技术用于分析来电者的语言,甚至也分析来电者讲话的语调,从语意及语调的模式,分辨出诈欺的可能性。此一技术可运用在银行业者,亦可运用在一般人防範电话诈欺。ECR我酷网

ECR我酷网

以深度学习防範金融诈欺ECR我酷网

在防範金融诈欺的应用上,在以自然语言处理技术了解来电者语意的同时,也利用深度学习技术分析来电话的语调,能够快速分辨电话诈欺。ECR我酷网

至于客户服务则可透过自然语言分析语意,再连结相关知识库,自动找出相关的客户服务或技术支援所需的资讯,协助客服人员提供更好的客户服务。ECR我酷网

富士通同时还展示一个正在研发中的ATM主动服务技术,这个应用需再结合富士通的眼球追蹤技术,只要在ATM提款机加装一个红外线发射与感应器,就能将提款者的眼球运动记录下来,也就是掌握了提款者的视线路径,而这些讯息再经过深度学习技术的模式,分辨来判断提款者是否有操作上的问题,一旦发现操作上有困难的提款者,系统就自动连结客服人员,透过提款机的萤幕与语音通讯即时提供协助。ECR我酷网

ECR我酷网

自动追蹤ATM使用者的状况ECR我酷网

富士通眼球追蹤技术与深度学习技术的结合,亦可运用于ATM提款机,透过掌握使用者的视线,可即时发现使用者的状况。ECR我酷网

ECR我酷网

可由感测器探知顾客视线ECR我酷网

透过视线检测系统搭配的小型视线感应器,可运用相机镜头与LED照明所各自反射的光线,判断出顾客眼睛所注视的位置。ECR我酷网

ECR我酷网

客服即时协助顾客ECR我酷网

透过行为模式辨识,一旦系统分析出使用者的视线路径显示操作有困难,就会立即通知客服人员,透过ATM的萤幕与通话提供即时协助。ECR我酷网

ECR我酷网

更準确辨识人的动作ECR我酷网

富士通研究所把混沌理论与CNN深度学习技术一起使用,先利用混沌理论将穿戴式装置收集的时序性资料转换成向量表示,再由CNN学习来归类,在识别人的行为上有更高的準确率。ECR我酷网

相同的技术也可运用在餐饮业的自助点餐系统,透过追蹤操作者的视线,可了解他对于哪些食物比较有兴趣,系统就可以进一步挑选对应的餐点来呈现。至于该如何掌握不同年龄或不同族群消费者的饮食喜好,富士通也进行一项深度学习技术的研发,将2万多张餐点照片输入资料库,让深度学习演算法自动学习不同族群的用餐喜好。ECR我酷网

ECR我酷网

依顾客反应自动推荐餐点ECR我酷网

富士通将深度学习与眼球追蹤技术运用于自助点餐机,透过眼球追蹤可掌握消费者当下的喜好,再由深度学习分析推荐合适的餐点。ECR我酷网

ECR我酷网

以深度学习分析饮食习惯ECR我酷网

藉助深度学习技术在图像辨识的强项,透过分析不同世代族群的餐桌照片,即可分析出不同年龄层的饮食习惯。ECR我酷网

ECR我酷网

运用深度学习,提升彩妆App建议能力ECR我酷网

藉助深度学习技术擅长的脸部分析,可进一步设计客製化的彩妆App,针对每个人不同的脸型,提供最佳的化妆建议。ECR我酷网

深度学习快速崛起,促使人工智慧再进化ECR我酷网

由上述应用可见,深度学习带动的人工智慧复兴,确实在许多应用上带来更多创新的可能性。不过深度学习技术毕竟发展才不过几年,其潜力有多大,其所能带动的人工智慧复兴,会掀起多大的浪潮尚无人得知。ECR我酷网

然而,正如Google执行长Sundar Pichai所言:「未来不再是行动优先,而是AI优先。」的确,整个世界已经从行动世代,往人工智慧世代移动了。ECR我酷网

相关报导请参考「富士通AI前进企业」ECR我酷网

上一篇  下一篇

I 相关 / Other

日企出现员工荒 [热事件]

网络配图近日,日本一项调查结果显示,日企出现员工荒,而调查中52.1%的日本企业人手不足,导致超过九成企业休假减少、出现人际关系恶化等现象。面临员工荒的企业中,61.9%采取放宽招聘条件、加薪等措施,不过只有40

打破技术与应用寒冬,深度学习掀起人工智慧新浪潮

深度学习技术是一种人工神经网络,是从脑神经科学获得启发,效法神经元的多层次学习网络,在图像辨识上先将图片分解成许多小像素,透过好几层的处理,以撷取、结合特徵,最后对图像中的物件提出预测。 图片来源: i

GMF团队| 感动自己,感动他人,定能收获回报

GMF团队| 感动自己,感动他人,定能收获回报
“2016年7月,捷米梵童装2016年终端年中会议圆满举行。来自广州和深圳终端门店的30多位捷米梵精英店长相聚在一起,总结半年来的工作得失,分享成功经验,表彰

当阳电厂爆炸原因最新调查结果 企业法人被控制 [非常娱乐]

当阳电厂爆炸原因最新调查结果 企业法人被控制 [非常娱乐]昨日,涉事公司蒸汽管道爆裂事发地,受蒸汽冲击破坏,现场一片狼藉。11日下午,该公司发生爆管事故,致21人死亡、5人受伤。新华社发8月11日下午,湖北当阳市

歹徒上网学习制伪卡 收购信用卡卡号盗刷

刑事局破获一起信用卡盗刷案件!警方调查发现,嫌犯利用收购的信用卡卡号,在网络商店购买高单价商品,短短一个月內,至少30人受害,其中一名被害人被盗刷金额高达33万元,警方循线逮捕2名嫌犯。 今(105)年7月间警方

I 热点 / Hot