张通社 zhangtongshe.com
又一家科创板上市公司来了。
9月26日,上海合合信息科技股份有限公司(以下简称“合合信息”)正式在上海证券交易所科创板上市。截至今日收盘,合合信息报113.62元,涨幅105.91%,成交额14.74亿元,换手率76.75%,总市值113.62亿元。这也意味着,合合信息成为“智能文字识别第一股”。
本次IPO,合合信息募集资金总额为13.8亿元,募集资金净额为12.7亿元。招股书披露,资金将用于人工智能C端产品及B端服务研发升级项目;商业大数据C端产品及B端服务研发升级项目;人工智能核心技术研发升级项目,以及商业大数据核心技术研发与数据中台建设项目。
成立于2006年,合合信息业务坚持B端C端“两条腿”走路,其中C端产品有扫描全能王APP、名片全能王APP、启信宝APP等,B端则是智能文字识别与商业大数据服务和产品等。
18年来,合合信息在智能文字识别领域的市场竞争力处于行业头部,比如扫描全能王和名片全能王在全球拥有超过9.4亿的累计下载量,月活跃用户接近1.5亿;启信宝在中国商业信息查询C端市场中排名第三,拥有超1000万的累计用户。
01、56岁湖北老乡即将拿下一个IPO
这是一支技术驱动的团队。
合合信息的创始人镇立新出生于1968年,湖北人,毕业于中国科学院自动化所,取得模式识别与人工智能博士学位。
毕业后,他曾任中国石化集团公司洞庭氮肥厂电气工程师、大连海事大学讲师;2000年,据公开信息报道,镇立新成为摩托罗拉全球实验室的主要负责人,主攻OCR技术,即光学字符识别,不久后,该技术运用到摩托罗拉“明”系列的触屏领域。也因此,镇立新成为全球首位将OCR、名片识别及手写识别技术运用到智能手机上的科学家。
智能时代的到来,让商业嗅觉敏锐的镇立新嗅到了机会,2006年创立了合合有限,即合合信息的前身。2009年,镇立新全职投入合合信息。
据悉,那年年底,合合信息的处女作“名片全能王”正式登录苹果的App Store;随后一年,合合信息又推出了另一款产品“扫描全能王”;2015年左右,合合信息正式推出名片全能王企业版。
值得注意的是,2013-2021年,合合信息连续9年被上海市经济和信息化委员会授予上海市“专精特新”中小企业资质;2017年入选中国大数据产业生态大会评选的“中国大数据50强企业”榜单;2022年入选上海市科学技术委员会同市经济和信息化委员会、上海市财政局共同发布的“2021上海科技小巨人企业”名单。
合合信息的创始团队成员,大多是人工智能专业出身。除创始人镇立新外,合合信息的陈青山是上海交通大学控制理论与控制工程硕士,他曾任职于阿尔卡特苏州通讯有限公司,现为合合信息的大数据技术负责人。
这支团队还收获了大批明星资本的青睐。企查查数据显示,2011年至2017年,合合信息共完成4轮融资,获得了京东科技、重庆文创基金、SK Ventures、东方富海、经纬创投等知名机构的青睐。
一路走来,合合信息的IPO之路有些曲折。2021年9月27日,合合信息首次向科创板递交招股书,如今已经过去了3个年头。
如今,这位56岁的湖北籍老乡要去IPO敲钟了。
02、B端和C端“两条腿”发力,预计前9个月营收超10亿
一直以来,合合信息基于自主研发的领先的智能文字识别及商业大数据核心技术,为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务。
公司C端业务主要为面向全球个人用户的C端APP产品,包括扫描全能王(智能扫描及文字识别APP)、名片全能王(智能名片及人脉管理APP)、启信宝(企业商业信息查询APP)3款核心产品。
截至2023年12月31日,扫描全能王曾在App Store上84个国家和地区(含中国)的效率类免费应用下载量排行榜位列第一,名片全能王曾在App Store上41个国家和地区的商务类免费应用下载量排行榜位列第一。
要特别提一提2015年上线的启信宝。其数据API、数据包、数据同步服务的数据源自公司汇集中国境内超过3亿家企业等组织机构的超过2000亿条商业大数据的数据平台,主要的受众为泛法务、泛商务、政务等行业的职场用户,为用户提供企业查询、商业尽调、风险管理、智能营销、企业服务等场景下的数据服务,还提供了微信小程序与功能更为丰富的网页版供用户使用。
公司B端业务为面向企业客户提供以智能文字识别、商业大数据为核心的服务,形成了包括基础技术服务、标准化服务和场景化解决方案的业务矩阵。
据悉,合合信息核心技术包括智能文字识别及商业大数据技术。其中智能文字识别技术融合了智能图像处理、复杂场景文字识别、NLP等AI技术,相比传统简单文字识别,具备更多认知与理解能力,可适应多语言、多版式、多样式等复杂场景,并可应用到多个商业化场景中并形成落地的产品或服务,例如票据分类、证照票据结构化、合同关键信息抽取、智能审核等。
深度学习技术作为合合信息的核心技术,它模拟了人脑神经元之间的连接模式,通过多层次的网络结构学习数据的特征表示。这种技术使得机器能够像人类一样,从海量的数据中提取出有用的信息。
公司B端业务为面向企业客户提供以智能文字识别、商业大数据为核心的服务,形成了包括基础技术服务、标准化服务和场景化解决方案的业务矩阵,满足客户降本增效、风险管理、智能营销等多元需求,助力客户实现数字化与智能化的转型升级。
合合信息在智能文字识别、商业大数据两类服务已覆盖了近30类行业的众多头部客户,《财富》杂志2022年8月发布的世界500强公司名单中,公司已覆盖超过125家世界500强客户。目前,B端服务已在银行、证券、保险、政府、物流、制造、地产、零售等近30个行业实现成熟应用。
招股书显示,根据App Annie数据,2020年、2021年以及2022年,扫描全能王与名片全能王的活跃用户、用户下载量之和远大于同类别APP,iOS评分也均高于同类APP。根据灼识咨询,2022年中国商业信息查询C端市场(即商业大数据C端市场)中启信宝位列第三名。
公司的C端业务销售模式主要为通过APP或者Web端直接面向个人用户销售智能文字识别或者商业大数据产品的VIP会员或按次付费产品,B端业务销售模式主要为直销,经销模式占比较小。
招股书显示,合合信息2021年、2022年、2023年营收分别为8.06亿元、9.88亿元、11.87亿元;净利分别为1.44亿元、2.84亿元、3.23亿元;扣非后净利分别为1.39亿元、2.65亿元、2.97亿元。
合合信息2024年上半年营收6.88亿,较上年同期的5.65亿元增长21.85%;净利为2.2亿元,较上年同期的1.87亿元增长18.15%;扣非后净利为2.06亿元,较上年同期的1.78亿元增长15.74%。
03、AI浪潮下合合信息的扩张之路
大模型变革的浪潮里,以数据为中心,成为行业人士从事大模型研发和应用的共识。具体到实践层面,大模型上游阶段在文本解析、逻辑版面、文档问答等方面,仍有很多的提升工作可以做。
2024年的《国务院政府工作报告》中,将“大力推进现代化产业体系建设,加快发展新质生产力”列为十大工作任务之首,并提出积极推进数字产业化、产业数字化,促进数字技术和实体经济深度融合,而合合信息智能文字识别与商业大数据的产品及服务与国家科技创新战略和相关产业政策恰好匹配。
为了帮助企业应对数据局限问题,日前,合合信息在WAIC 2024上发布了用于大模型语料训练的“加速器”产品——TextIn智能文档处理平台。据公开报道,该平台在训练前期阶段,使用“加速器”文档解析引擎,破解书籍、论文、研报等文档中的版面解析障碍,为模型训练与应用输送纯净的“燃料”;同时,“加速器”搭载了文本向量化模型,以解决大模型“已读乱回”的幻觉问题。
值得一提的是,合合信息还携手华南理工大学团队,将AIGC技术应用于敦煌遗书残卷的图像数字化修复上,共同打造了AI古籍修复模型,有效解决了中文古籍文档中的诸多问题。AI修复技术,能够自动识别并修复古籍中的损坏部分,实现1:1的还原。这无疑为古籍保护提供了新的思路和方法。
从2018年,OpenAI发布超大模型GPT-1开始,大模型在各应用场景崭露头角,其应用场景广泛且多样化。从自然语言处理到图像生成,从音频处理到视频、3D场景创建,大模型能够应对多领域的挑战。
此外,随着科学技术的发展,促进AI产业与高校人才培养相融合也正成为业界关注的焦点。早在7月,合合信息还联合同济大学软件学院成立“产教融合人才培养签约暨创新实践基地”。
据悉,此次合作双方将通过产学研联合研究的形式,在人工智能技术、数据分析和处理、移动应用等领域展开科研合作。
未来,大模型有望为更多应用场景带来更多机会和创新,人工智能领域的各参与者也在竞相探索商业化落地场景。大数据是AI深度学习的基础,只有不断给AI系统喂新数据、新知识,它才能变得更聪明。
全球AI及大数据的技术和产品呈现更迭迅猛,合合信息也随时面临着挑战,比如微信等社交软件迅速崛起,部分用户使用社交软件交换联系方式来替代交换纸质名片,导致名片全能王的APP月活出现下降;在智能文字识别业务方面,公司如何精准把握下游不同行业、不同规模客户差异化需求……
此次,合合信息成功上市,关于它的成长路径,或许又会有新的可能。
文字|章同林 编辑|刘程星