查看: 1630|回复: 0

能够识别图片中的物体的智能工具

[复制链接]
  • TA的每日心情
    擦汗
    2024-5-31 10:44
  • 签到天数: 1492 天

    连续签到: 1 天

    [LV.10]以坛为家III

    发表于 2015-5-21 08:14:58 | 显示全部楼层 |阅读模式
    分享到:

    1.png

    人工智能研究最有趣的领域之一就是计算机视觉(computer vision),从无人驾驶汽车内部构件到机器猜年龄,计算机视觉系统软件拥有着很大的开发潜能。

    近期,计算机科学家史蒂芬·沃尔夫勒姆(Stephen Wolfram)发布了一种新工具,名叫“沃尔夫勒姆图片识别项目”( Wolfram Image Identification Project)。用户借助这项工具首先需要上传或者链接到一张图片,然后就可以看到计算机如何来识别图片中物体。

    沃尔夫勒姆是这样描述他的工具的:跟很多计算机视觉项目不同,沃尔夫勒姆项目围绕一种“人工神经网络”而建立。人工神经网络实际上是一种软件框架,它的设计灵感来自能够进行图片识别的生物大脑。沃尔夫勒姆构造的“人工神经网络”是可以通过数千万标签图片“训练”出来的。

    “我们不需要用老方法来描述一个物体,比如椅子。我们所做的一切就是提供很多类型的椅子。你也可以这么说,‘任何跟我们想将其定义为椅子的物体’。这样,我们就会把那些跟我们所定义的‘椅子’很接近图片贴上‘椅子’标签,其他则排除在外。”沃尔夫勒姆表示。



    2.png

    Business Insider网站通过测试发现,在多数情况下,这款图片识别器能够至少抓住图片中的“关键点”。比如,它能够将希拉里·克林顿和玛丽莎·梅耶尔准确地归类为“人”,不过它无法识别按名字来识别出他们。它能够将Paris cafe Le Comptoir归类为“一座建筑”。



    3.png

    不过,在某些情况下,沃尔夫勒姆识别工具会完全忽略掉图片中的人,将焦点集中于某些没有生命的物体上。比如,在拳王格罗夫金(Gennady Golovkin)一张拳击比赛图片中,这项算法锁定在了拳击手套上,并提供了有关这双拳击手套的其他信息,比如重量和材质。



    4.png

    在另一张肯德基宣传广告图片中,该算法忽视掉了里面的主人公,只是将焦点放在了主人公身旁的汽车,并将其识别为“交通”。

    对于三星手机,这项工具将其识别为“远程控制”,跟上面提到的拳击手套一样,系统还提供一些文字介绍。



    5.png

    在这张特斯拉汽车图片中,系统注意到了汽车前面站立的人(特斯拉CEO马斯克),但是它将马斯克身后的汽车归类为“两门”小轿车,而不是四门汽车。



    6.png

    在另一张视频游戏Doom4截图中,系统将图片中的士兵竟然识别为一只“蜘蛛”,并在下面提供有关这类蜘蛛的名称和最大年龄信息。

    回复

    使用道具 举报

    您需要登录后才可以回帖 注册/登录

    本版积分规则

    关闭

    站长推荐上一条 /4 下一条

    手机版|小黑屋|与非网

    GMT+8, 2024-11-26 16:44 , Processed in 0.124879 second(s), 16 queries , MemCache On.

    ICP经营许可证 苏B2-20140176  苏ICP备14012660号-2   苏州灵动帧格网络科技有限公司 版权所有.

    苏公网安备 32059002001037号

    Powered by Discuz! X3.4

    Copyright © 2001-2024, Tencent Cloud.