每日经济新闻
要闻

每经网首页 > 要闻 > 正文

专访北大计算机研究所副所长汤帜:探索区块链版权保护但不炒概念 数字出版产业已到成熟期

每日经济新闻 2018-03-28 17:28:16

汤帜对《每日经济新闻》(以下简称NBD)记者表示,经过将近20年的探索,整个数字出版行业在技术上已经趋于成熟,而近两年发力的点则是文档处理和知识服务技术的升级。

每经编辑 每经记者 张虹蕾    

北京大学计算机科学技术研究所副所长汤帜

每经记者 张虹蕾 北京摄影报道 每经编辑 任芷霓

作为当代中国印刷业革命的先行者,计算机汉字激光照排技术创始人王选的“得意门生”,北京大学计算机科学技术研究所(以下简称北大计算机研究所)副所长汤帜已经在新闻出版应用技术领域征战已近30年。

从跨进北大校门算起,今年已经是汤帜在北大学习和工作的第35个年头。自1987年师从王选教授攻读硕士研究生开始,汤帜就把全部的精力投入到软件的研究与开发。汤帜对于我国自有知识产权软件领域有两大贡献,分别为方正飞腾排版与方正阿帕比数字版权保护系统。

业界对于汤帜的美誉颇多,有人说汤帜率领的团队的努力带活了一个产业,把Adobe强敌挡在国外。而在北京大学计算机科学技术研究所35周年之际,《每日经济新闻》记者专访汤帜,和他一起探讨中国数字出版产业近年来的变革之路。

汤帜对《每日经济新闻》(以下简称NBD)记者表示,经过将近20年的探索,整个数字出版行业在技术上已经趋于成熟,而近两年发力的点则是文档处理和知识服务技术的升级。

谈行业变革:2C赶超2B市场 深度内容待挖掘

NBD:行业起步的十多年来,我国数字出版产业产生了哪些变化?

汤帜:2000年初,国内互联网环境不够成熟,未形成个人支付习惯,数字出版基本没有2C市场,主要面向2B领域的机构服务。上述模式持续将近十几年,产业具备一定规模时,互联网风暴被掀起,网络文学也开始获取流量,近几年2C网络文学市场的用户量超过2B市场。

NBD:网络文学也催生内容付费潮流的发展,这对数字出版行业带来哪些变化?

汤帜:从技术角度看,网络文学以文字为主,一般基于网页浏览,对于文档处理技术要求较低。值得注意的是,虽然B2C市场看起来规模很大,但一些低俗猎奇文章充斥市场;相较于网络文学,内容有深度的专业电子书,特别是科技类电子书的B2C规模较小,这一市场销量大幅度提升还需时间。

NBD:对于上述市场现象,有解决途径吗?

汤帜:文档处理技术的升级或许是一个打开专业类市场的“突破口”。不同于网络文学的纯文字,专业类书籍则涵盖图表、公式,在处理复杂版式的过程中,需要用到“门槛高”技术。此外,要想解决上述市场现象,还需要产业界各方共同努力。

谈发展突破:结合新技术挖掘应用点

NBD:数字版权保护技术目前是否已经很成熟,还需要攻克哪些难题?

汤帜:经历将近20年的探索应用,数字版权保护技术已进入成熟期。但不可忽视的是,随着技术更新迭代,也要求研究机构作出相应思考,为现有的数字版权保护锦上添花。

比如,北大计算机研究所也会探索区块链在版权保护中应用,但目前究竟新技术能够产生怎样的化学反应尚不可预知。此外,作为研究机构,也不会关注热点概念“炒作”,而是去挖掘真正能够结合应用具体落地点。

从研究层面和技术层面来看,我希望能够用先进的技术带来更好的阅读体验;但从市场角度来讲,出版方也需要有动力驱动,技术推广程度和也和受众素质及整体行业环境相关。希望阿帕比这类公司能根据此前技术积累不断革新,引领行业发展。

NBD:您目前是研究者,此前也在企业作出相应指导,您认为一些数字出版的研究怎样才能更好落地?

汤帜:从2000年开始带领团队研究技术,就一直沿着研究、开发、应用一条龙的模式去思考,研究成果和企业应用基本能够达到无缝衔接。而现在出现的变化则是,市场上数字出版的公司越来越多,我们也用开放的心态面对市场,不会拘泥于方正或者阿帕比某几家公司,而是把合适的技术提供给更需要的企业。

例如,眼下化学公式的检索技术,在药物成分分析领域对于这一技术的需求十分迫切,就可以和相关单位达成合作和研究,在药物分子库的构建领域,提供分子式自动识别、检索等技术。

谈技术演进:促进版权保护 降低人工成本

NBD:阿帕比系统技术特点是什么?

汤帜:阿帕比技术是从2000年开始做的,彼时,中国的数字版权刚刚起步,模式也仅是网络电子图书的在线购买。阿帕比技术主要的技术特点包括两个,一个是数字版权保护技术实现了产业链各环节的保护;另一个是实现了版式和流式融合的CEBX文档技术,使一个文档既支持原版原式的阅读或打印,也支持在移动终端高质量地实时排版阅读。

阿帕比技术支持出版社、图书馆、电子运营商、读者等各个环节的版权保护技术,使得整个产业链条形成透明的交易环境,有利于出版社看到交易情况,定制相应机制,形成良性循环。

NBD:技术革新是否也会降低人工成本?

汤帜:是的,目前大家都在做移动数字阅读,移动阅读需要把PDF文件转换为其他流式阅读的格式,需要很多人工校对的工作。因此,我们研究版面分析与理解技术,使PDF转化为移动阅读格式时自动化程度更高,目前版面复杂的文档转化能够达到80%~90%准确度,未来希望结合人工智能等技术将转化准确率提升到99%以上。版面分析与理解技术还可以把表格、数学公式等复杂版面转换为结构化、语义化的信息。例如,针对上市公司年报的PDF文档,可以把其中的表格转换为Excel数据。

如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。

读者热线:4008890008

特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。

北京大学 计算机研究所 汤帜 区块链 数字出版产业

欢迎关注每日经济新闻APP

每经经济新闻官方APP

0

0