能够识别图片中的物体的智能工具

wudianjun2001 · 发表于 2015-5-21 08:14:58

人工智能研究最有趣的领域之一就是计算机视觉（computer vision），从无人驾驶汽车内部构件到机器猜年龄，计算机视觉系统软件拥有着很大的开发潜能。

近期，计算机科学家史蒂芬·沃尔夫勒姆（Stephen Wolfram）发布了一种新工具，名叫“沃尔夫勒姆图片识别项目”（ Wolfram Image Identification Project）。用户借助这项工具首先需要上传或者链接到一张图片，然后就可以看到计算机如何来识别图片中物体。

沃尔夫勒姆是这样描述他的工具的：跟很多计算机视觉项目不同，沃尔夫勒姆项目围绕一种“人工神经网络”而建立。人工神经网络实际上是一种软件框架，它的设计灵感来自能够进行图片识别的生物大脑。沃尔夫勒姆构造的“人工神经网络”是可以通过数千万标签图片“训练”出来的。

“我们不需要用老方法来描述一个物体，比如椅子。我们所做的一切就是提供很多类型的椅子。你也可以这么说，‘任何跟我们想将其定义为椅子的物体’。这样，我们就会把那些跟我们所定义的‘椅子’很接近图片贴上‘椅子’标签，其他则排除在外。”沃尔夫勒姆表示。

Business Insider网站通过测试发现，在多数情况下，这款图片识别器能够至少抓住图片中的“关键点”。比如，它能够将希拉里·克林顿和玛丽莎·梅耶尔准确地归类为“人”，不过它无法识别按名字来识别出他们。它能够将Paris cafe Le Comptoir归类为“一座建筑”。

不过，在某些情况下，沃尔夫勒姆识别工具会完全忽略掉图片中的人，将焦点集中于某些没有生命的物体上。比如，在拳王格罗夫金（Gennady Golovkin）一张拳击比赛图片中，这项算法锁定在了拳击手套上，并提供了有关这双拳击手套的其他信息，比如重量和材质。

在另一张肯德基宣传广告图片中，该算法忽视掉了里面的主人公，只是将焦点放在了主人公身旁的汽车，并将其识别为“交通”。

对于三星手机，这项工具将其识别为“远程控制”，跟上面提到的拳击手套一样，系统还提供一些文字介绍。

在这张特斯拉汽车图片中，系统注意到了汽车前面站立的人（特斯拉CEO马斯克），但是它将马斯克身后的汽车归类为“两门”小轿车，而不是四门汽车。

在另一张视频游戏Doom4截图中，系统将图片中的士兵竟然识别为一只“蜘蛛”，并在下面提供有关这类蜘蛛的名称和最大年龄信息。

站长推荐 /4