查看: 2375|回复: 0

数据处理之父赫曼·霍列瑞斯

[复制链接]

该用户从未签到

发表于 2008-6-26 11:19:32 | 显示全部楼层 |阅读模式
分享到:
在计算机发展史上,曾记录了一批业余发明家的丰功伟绩。他们既不是数学家,也不是专门从事电器设计的工程师,美国人口调查局的统计专家赫曼·霍列瑞斯(Herman Hollerith ,1860-1929)博士就是其中的代表人物。 公元1880年,美利坚合众国举行了又一次全国性人口普查,为当时5000余万美国人登记造册。在人口调查局从事统计工作的霍列瑞斯,静静地坐在他的办公室里,望着那汗牛充栋的人口登记册发愁。据他的估算,分析这些千辛万苦收集到的数据,人口调查局普查至少要花费7年时间。也就是说,美国政府和公民们,几乎要到下一次人口普查时,才能得知这次普查的人口状况,这岂不是太误事?
霍列瑞斯曾多次与同事们一起,走乡串户收集资料,深知每个数据都来之不易。他也曾终日埋在“数据堆”里,用手摇计算机“摇”得满头大汗,一天下来,也算不出几张表格。他心里默默地想,此时此刻再来作什么改进,当然于事无补。但是,“亡羊补牢,犹未晚矣”,为下一次人口普查“未雨绸缪”的事,应该早一点提到议事日程。想着想着,他随手取过手摇计算机,“摇”出了更一个惊人的数字:到1890年,美国人口还将增加1200万,若按老办法统计,即使再添加人手,没有10年以上的功夫,是根本搞不出什么结果的。他们迫切需要一种机器,帮助完成繁重的统计制表任务。
霍列瑞斯1860年诞生于纽约州北部一个德国侨民家庭。他从小喜爱数学,一般人看来枯燥乏味的数字,他却有浓厚的兴趣。19岁那年,他从哥仑比亚大学矿业学院毕业,获得博士学位。虽然学的是采矿专业, 却在人口调查局谋到了一份职位,充当他老师特里布里奇的助手。调查局的工作性质要求他“不仅掌握技术知识,而且经过了严格的科学训练和具有敏锐的观察能力”,而霍列瑞斯在大学里就承担过研究课题,他特别注意理论学习与实践活动的结合,除掌握必修的物理、化学等课程,他也涉猎过几何、制图、测量和统计分析等各种知识。此外,他还经常到工厂和商店考察和实习,接触社会。这一切,都给他后来的生活带来巨大的影响。
在人口调查局工作期间,发生了一件有趣的事情:霍列瑞斯爱上了一位名叫凯特·比林斯的漂亮姑娘。热恋和求婚的过程,使他有机会接近凯特的父亲——约翰·比林斯(J.Billings)博士,美国陆军派往人口调查局主管卫生统计的军医。比林斯博士学识渊博,曾长期担任美国军医署署长,主持制定了7种医药管理制度,亲手创办了世界上最大的医药文献中心,担任卡内基协会主席长达10年之久。尽管比林斯肩负重任,但他特别关心有才华的青年人,在与霍列瑞斯交往过程中,丝毫没有“权威”派头。
在一次交谈中,两人不约而同地提到人口普查统计机械化的问题,也同时想到这种机器可以由杰卡德编织机改造而成。真可谓“英雄所见略同”,他们与巴贝奇的灵感同出一辙,都受到“穿孔纸带”的启示,只是霍列瑞斯和比林斯又向前迈进了一步,他们提出:纸带上的这些“小孔”不仅能控制机器操作的步骤,而且能用来运算和储存数据。德高望重的比林斯,后来谦虚地把全部荣誉归功于青年人的创意,但霍列瑞斯坚持认为,比林斯在机器发明中发挥了最重要的作用:“他告诉我,机器完全可以承担制表和其他统计工作。他的构想是某种分布式的机械,采用卡片来储存个人资料,这种卡片可以用小刀刻出槽口,槽口就是杰卡德的‘小孔’……”
得到比林斯的鼓励,霍列瑞斯信心倍增,从此以全部身心投入到制表机的研制中。他设法弄到一台杰卡德编织机,剖析它的构造和原理。在此期间,他曾到麻省理工学院任教,一边教书,一边刻苦学习机械和电气技术。为了掌握发明的技巧和熟悉专利法,霍列瑞斯还到一家专利事务所工作过一段时间。
霍列瑞斯最初设计的制表机,几乎就是杰卡德编织机的“翻版”。将人口普查的数据制成“穿孔纸带”没有多大的困难,每个人的调查数据有若干项,诸如性别、籍贯、年龄等等,他可以把所有的调查项目依次排列,然后根据调查结果在每人的相应项目位置上穿孔。例如,约翰先生是40岁的男性公民,就在“性别”栏目“男”的名下打个小孔,在“年龄”栏目“40”之下也打个小孔,如此等等。当穿孔纸带的栏目统统被打上小孔之后,它就详细记录了某一次调查的结果。霍列瑞斯在他的专利申请书里描述过这种方法:“每个人的不同统计项目,将由适当的小孔来记录,小孔分布于一条纸带上,由引导盘牵引控制前进。”
基于这种设想,1884年,霍列瑞斯制作完成了第一台制表机。机器上装备着一个计数器,当穿孔纸带被牵引移动时,一旦有孔的地方通过鼓形转轮表面,计数器电路就被接通,完成一次累加统计。当年,他把机器运到巴尔的摩人口登记办公室去进行实验,尽管存在着许多问题,机器统计的先进性还是受到人们的欢迎。
原始的制表机工作不太可靠,迫使霍列瑞斯继续寻求改进。问题之一在于用“穿孔纸带”输入只能统计出总数,无法对个人数据进行分类和修改,也无法重新登记。
那一天,霍列瑞斯乘火车出差到美国西部办事,仍在苦苦思考改进的办法。他慢慢走向检票口,从口袋里掏出火车票,低头一看,一道灵感突然闪现,他顿时愣在那里。
检票员不断地催促:“先生,请您剪票!”
霍列瑞斯把车票递上前,检票员不耐烦地一把夺过去,只听“卡嚓”一响,属于他“个人”的这张车票,当即被“穿”了一个小孔。霍列瑞斯眼睛一亮,车也不上了,转过身,居然朝车站大门口走去。
此时,他的脑子里不断有个声音在说话:“一个人一张车票,车票就是每个人身份的个人记录。”穿孔纸带造成数据无法分类的困难就这样迎刃而解,解决的办法竟然如此简单:“把连续的“穿孔纸带”换成每人一张“穿孔卡片”,这是比林斯早就预言过的,我怎么就把它给忘记了呢?”
由于改用“穿孔卡片”输入数据,霍列瑞斯把他的制表机做了较大的改动。他用一种压力装置替代了牵引盘,数据卡片被夹在上下两个压力板中,下部压力板静止不动,上部压力板则带动卡片向前移动。更为巧妙的设计在于“自动统计”。改进的机器有若干只盛满水银的小杯,穿好孔的卡片必须经过水银杯。卡片正上方有几排精心调好的机针,连接在电路的一端,而那些水银杯则连接于电路的另一端。当机针遇到某张卡片有孔的地方,便自动跌落下去与水银接触,把电流接通,启动旁边的计数装置前进一个刻度。
统计分类问题解决之后,打孔的困难接踵而至。过去给穿孔纸带打孔,他用的是一种小型手持式装置,常常因用力过猛把纸带打破;而改换较厚的卡片后,打孔却变得非常费力。为了做试验,霍列瑞斯几乎每天都要不间断地给许多卡片打孔。他的岳母回忆说:“霍列瑞斯先生星期五从巴尔的摩回来,看来疲惫不堪。他说每天都要处理1000张卡片,每张卡片至少要打一个孔。可怜的孩子只好亲自动手做完这一切,手臂疼得都抬不起来……”不久之后,当霍列瑞斯再次回家,他告诉岳母,问题已经完全解决了,因为他改造了这种费力的打孔装置,设计出一个被他称为“缩放仪”的东西,即一种半自动打孔机,大大提高了工作效率。他还高兴地讲,因为有了新的打孔设备,他已经雇佣了一些女职员来从事过去繁重的体力劳动,平均每个人一天能轻松地处理700张卡片。 以我们今天的眼光看,这些女职员可能就是世界上第一批“数据录入员”。
霍列瑞斯的制表机现在已经可以经受实战考验了。1888年,这台机器被比林斯介绍给一家军队医院,用于医药资料的统计,试验获得圆满成功,还被送往巴黎国际博览会展出。美国军方对这种制表机大感兴趣,向霍列瑞斯提供了资助,使他有了进一步改进机器的财力,满怀信心迎接人口普查的挑战。
1890年,第12次人口普查即将开始,人口调查局以向社会招标的方式,征集计算设备和统计方案。前来应征的共有三个人。霍列瑞斯的主要竞争对手是威廉姆·亨利和查尔斯·皮格金,其中,亨利还是人口调查局的头头。他俩提供的方案都是用有色卡片来记录资料,以便于区分数据类型,但统计工作仍然靠手工完成。只有霍列瑞斯运来了一套前所未有的自动制表机。
招标需要经过严格的测试,以相同的数据完成统计任务,并根据时间快慢决定胜负。经过数天的紧张“比赛”,结果已见分晓:录入数据的过程,亨利和皮格金分别用了144小时和100小时,霍列瑞斯的机器只用了72小时;数据统计的过程,亨利和皮格金分别耗费44小时和55小时,霍列瑞斯制表机再次夺冠,仅仅用了5小时28分钟。制表机以无可置疑的优势,让霍列瑞斯赢得了这个合同。
第12次人口普查共设立了235个调查点,动用了超过5万人来负责组织登记和填写表哥。调查内容也比往年增添加了许多,包括性别、婚姻状况、有无孩子等40个项目,数据总量比1870年的普查增加了6倍以上。从正式登记日起,霍列瑞斯机器的速度和可靠性一直令人感到惊讶。每一台制表机都连接着40台计数器,处理高峰期,一天能统计2000~3000个家庭数据,总共处理的人数达到600万人。在霍列瑞斯制表机支持下, 第12次人口普查的统计工作仅用了6个星期时间,其中一部分时间还被用来处理上次普查的遗留问题。 这种制表机为人口调查局节省了约500万美元费用,是霍列瑞斯本人估计的10倍。人口调查局在报告中写道:“用这种机器,在不增加费用的前提下,过去许多无法编制的表格现在都有可能统计出来了。”
霍列瑞斯获得了巨大的成功,也使他看到了一个有巨大前景的市场。1896年,他趁热打铁创办了一家专业制表机公司,影响力甚至扩大到俄罗斯、加拿大和挪威等国。然而,统计学家毕竟缺乏经商才干,他的公司不久便因资金周转不灵陷入窘境,只好任别人收购。经过几次改组,这家公司最终发展为著名的国际商用机器公司(IBM公司)。
虽然霍列瑞斯的发明并不是通用计算机,除了能统计数据制造表格外,制表机几乎没有别的什么用途,然而,制表机的穿孔卡第一次把数据转变成二进制信息。在早期计算机系统里,这种用穿孔卡片输入数据的方法,一直沿用到20世纪70年代,数据处理也发展成为电脑的主要功能之一。
1923年,霍列瑞斯博士出版了关于计算机的著作,对计算机未来做出了许多正确的预见,为穿孔卡计算机的发展奠定了基础。为此,他还获得了西方好几个国家的近50项专利,几乎垄断了这一领域的全部发明权,并使他跻身于“数据处理之父”的行列。
回复

使用道具 举报

您需要登录后才可以回帖 注册/登录

本版积分规则

关闭

站长推荐上一条 /4 下一条



手机版|小黑屋|与非网

GMT+8, 2024-11-15 22:21 , Processed in 0.129734 second(s), 15 queries , MemCache On.

ICP经营许可证 苏B2-20140176  苏ICP备14012660号-2   苏州灵动帧格网络科技有限公司 版权所有.

苏公网安备 32059002001037号

Powered by Discuz! X3.4

Copyright © 2001-2024, Tencent Cloud.