近日,谷歌发布了最新版机器学习系统,通过识别图像中的内容,配上对应文字,效果达到了历史最佳。
谷歌已经在 TensorFlow 上开源了这项成果。自 2014 年以来,谷歌一直致力于这个项目,现在这个算法描述图像的准确率已经高达 93.9% 。
谷歌研究的博客发文说:“令人兴奋的是,在展示全新情境时,我们的模型的确可以产生准确的配文,这显示出系统对图像中目标和背景的理解更深了。”同样重要的是,“它还学会了如何表示知识在自然的英语短语,尽管它只读了人类给的说明字幕,没有在接受其他额外的训练。”