电子书校对五大问题经验谈

浏览数:26
文章附图


一本电子书的质量好坏,其中校对起决定性作用,现有的一些自动校对软件功能实在不能令人满意。


电子书,无论是网上下的、OCR识别的、或者是自己手打的、还是自己的写的。出现错误的原因主要有以下几类


问题一:

广告:这是网上下txt书的通病。别人帮你制作了txt书,总是要获取利润。不过这种回报让制作电子书的人耗尽了力气。好在这种广告还是有一定的规律可循。建议查找"."、"("、"["等特殊符号,可以发现大部分的广告或签字(水印)。然后分别用查找和替换(成空串)解决。


问题二:

为了避开某些字而"**"来取代:我们也可以查找"*",发现后,根据上下文确定应该还原成什么字只能是半人工的。


问题三:

输入时引入的别字,同音字,同码字:这个是最难以区别和校对的常常只能仔细阅读一遍来校对了,建议也可以找一个好的阅读和修改软件,可以提高效率。


问题四

有的电子书籍会出现许多乱码,注意:这里说的不是整本书中都是乱码,那样的话可能是格式错误或者选错了显示的编码,只要按正确格式打开,或者选择正确的编制码就会好。部分文字出现乱码可能是文本损坏。这时候修复要看情况了。可以用查看编码软件(如CodeView)打开后试着还原如果说是个别字被删除了单个字节,还是可以恢复的。


问题五:

段内多了换行符:从其它格式转成txt时经常有这个问题,通常情况下,段内的换行符比较多,一篇文章有时数百上千个,手动编辑改动是很难提高效率的曾经在一次校对中,从一个pdf转成word再转成txt,(直接从pdf转txt时多出了许多页码,先转成word后就没有页码了。)这个过程十分的繁琐,并且校对效果并不让人满意,后来发现实际上这些换行还是有规律可循的。


比如:正常的换行(段未换行)通常都是一些结句的标点,比如"。"、"!"、"”"、"’"、"`......"。非正常的换行(段内换行)会有汉字后就是换行;","后换行等非结句的标点后直接换行,知道了这个特点,我用textpro来查找汉字后换行(\c$)再用\d替换,去掉换行符,查找",$",或";$",用\d去掉换行符,几次就完成了......


最后我们要确定的是:用一些编辑软件的删除段内换行符功能,可能会把段末的换行符也去掉了,整篇文章变成了一个段。除非手工指定段(选择块,在块内使用删除段内换行符),但要切记要定义多少个块因为主要是程序无法判断分段。



帅创之亿校对公司,是一家国内专业的校对公司。

主要业务:校对、专业校对、档案整理、电子校对,以质量高,价格低,服务好的最佳结合,赢得客户的一致好评!

联系电话:18610868638



专业的事,交给专业的人
 专业的事,交给专业的人来  以质量高,价格低,服务好的最佳结合,赢得客户的一致好评! 
专注我们所拥有的,而不是我们所缺少的。——2020.5.8

会员登录
登录
留言
回到顶部
/以下是360自动收录