首页 > 娱乐前沿 > 科技
脸书靠AI分辨图片中的文字,每天可过滤10亿则
小柯 2018-09-12 13:06:22
图片来源:

脸书p3p我酷网

为了提升图片搜寻及加强过滤有害及其他不当资讯,脸书(Facebook)发展了图片中文字的分辨技术,并宣称现在每天已经可以过滤10亿则图片。p3p我酷网

脸书与Instagram平台上的大量相片中有各种不同文字型式,有的是层叠在表情符号上、或有的是镶嵌在店家大门、招牌或餐厅菜单上。脸书和Instagram上的相片数量、文字型式及支援的语言种类之多,传统光学字元分辨(OCR)只能分辨字元但不理解图片的上下文。p3p我酷网

为解决这个问题,脸书开发出了大规模机器学习系统Rosetta,它如今每天从超过10亿幀脸书和IG的公开图片和视频讯框中即时萃取出文字,输入已经训练可以同时理解文字和图片的文字分辨模型中。p3p我酷网

Rosetta萃取图片中文字的过程包含二个步骤。先以Faster△R-CNN侦测可能包含文字的矩形区块,再以经过连结时间序列分类损失(Connectionist△Temporal△Classification△loss, CTC△loss)训练过的完整卷积神经网络(Convolutional△Neural△Networks, CNN)来分辨及转录出该区块中的文字。他们是将文字分辨视为一种解决序列预测问题的过程,输入端是包含文字的图片,结果就是图像中字元排成序列,之后利用CTC△loss来训练这个序列模型,结果就能分辨出任意长度的文字,以及训练中没有见过的文字。p3p我酷网

现在这个模型不只能分辨英文,目前也支援阿拉伯及印度语,克服了文字由右到左或是堆叠字元的挑战。p3p我酷网

现在脸书已经能有效每天分辨脸书和IG上超过10亿公开的图片,这些萃取出来的文字都被平台上的分类器用来即时纠出违反政策的仇恨、暴力内容、用于脸书的图片搜寻功能中,或改善动态消息中的个人化内容。p3p我酷网

脸书表示,下一步要处理的挑战包含图片经过旋转、变型、模糊化、或其他扭曲方式使文字不易辨读、照片中文字和街景混杂、平台上愈来愈多的视频内容,以及现有英文及拉丁语系文字外的更多文字支援,Rosetta现有技术对这些内容仍心有余而力不足。p3p我酷网

上一篇  下一篇

I 相关 / Other

DARPA将投入超过20亿美元启动第三波军事化AI技术

第二波的人工智能技术建立在大量的资料基础上,无法适应不断变化的条件,现在美国国防先进技术研究计划机构(Defense△Advanced△Research△Projects△Agency,DARPA)开始了AI△Next计划,研发下一代人工智能演算法

Airbnb 租房闹钟内藏针孔镜头 情侣游多伦多险被偷怕 | 香港 UNWIRE.HK 玩生活.乐科技

早前 Uber 在香港发现怀疑偷拍事件,现在另一共享模式的集团 Airbnb 也在加拿大爆出偷拍丑闻。一对英国情侣 Dougie Hamilton 和 Tary Vernoy 上星期到多伦多旅游, 通过 Airbnb 于当地预订了一间公寓,当两人玩了一整

WhatsApp 推出 KaiOS 版 Nokia 8110 4G 香蕉仔都可用 | 香港 UNWIRE.HK 玩生活.乐科技

现在手机市场除了 Android 和 iOS,于印度等新兴市场还有 KaiOS 争逐廉价手机市场,KaiOS 以 Firefox OS 为基础开发,提供有限度的智能手机功能。印度品牌 JioPhone 和 Nokia 都有采用 KaiOS 推出手机,早前在香港上

【评测】宝丽来OneStep+即影即有 声控拍照+Light Painting | 香港 UNWIRE.HK 玩生活.乐科技

大家有没有试过声控操作即影即有呢 - 宝丽来新的即影即有OneStep+就可以啦 ! Polaroid?OneStep+可以用手机应用程序控制即影即有,程式内更有许多不同功能,包括 :?声控拍摄、光影涂鸦、双重曝光等,十分吸引 ! 鸡蛋妹

瞄准企业AI运算需求,思科也推AI伺服器

图片来源: Cisco 赶搭AI伺服器风潮,思科周一宣布扩增其Unified△Computing△System(UCS)伺服器系列,包含支援企业AI运算作业的UCS△C480 ML△M5。M5是一台4U伺服器,搭载Intel△Xeon△Scalable处理器。它是由思科

I 热点 / Hot