人工智能研究最有趣的领域之一就是计算机视觉(computer vision),从无人驾驶汽车内部构件到机器猜年龄,计算机视觉系统软件拥有着很大的开发潜能。 近期,计算机科学家史蒂芬·沃尔夫勒姆(Stephen Wolfram)发布了一种新工具,名叫“沃尔夫勒姆图片识别项目”( Wolfram Image Identification Project)。用户借助这项工具首先需要上传或者链接到一张图片,然后就可以看到计算机如何来识别图片中物体。 沃尔夫勒姆是这样描述他的工具的:跟很多计算机视觉项目不同,沃尔夫勒姆项目围绕一种“人工神经网络”而建立。人工神经网络实际上是一种软件框架,它的设计灵感来自能够进行图片识别的生物大脑。沃尔夫勒姆构造的“人工神经网络”是可以通过数千万标签图片“训练”出来的。 “我们不需要用老方法来描述一个物体,比如椅子。我们所做的一切就是提供很多类型的椅子。你也可以这么说,‘任何跟我们想将其定义为椅子的物体’。这样,我们就会把那些跟我们所定义的‘椅子’很接近图片贴上‘椅子’标签,其他则排除在外。”沃尔夫勒姆表示。
Business Insider网站通过测试发现,在多数情况下,这款图片识别器能够至少抓住图片中的“关键点”。比如,它能够将希拉里·克林顿和玛丽莎·梅耶尔准确地归类为“人”,不过它无法识别按名字来识别出他们。它能够将Paris cafe Le Comptoir归类为“一座建筑”。
不过,在某些情况下,沃尔夫勒姆识别工具会完全忽略掉图片中的人,将焦点集中于某些没有生命的物体上。比如,在拳王格罗夫金(Gennady Golovkin)一张拳击比赛图片中,这项算法锁定在了拳击手套上,并提供了有关这双拳击手套的其他信息,比如重量和材质。
在另一张肯德基宣传广告图片中,该算法忽视掉了里面的主人公,只是将焦点放在了主人公身旁的汽车,并将其识别为“交通”。 对于三星手机,这项工具将其识别为“远程控制”,跟上面提到的拳击手套一样,系统还提供一些文字介绍。
在这张特斯拉汽车图片中,系统注意到了汽车前面站立的人(特斯拉CEO马斯克),但是它将马斯克身后的汽车归类为“两门”小轿车,而不是四门汽车。
在另一张视频游戏Doom4截图中,系统将图片中的士兵竟然识别为一只“蜘蛛”,并在下面提供有关这类蜘蛛的名称和最大年龄信息。 |