一本适合Kindle阅读的塞尔维亚语小说的电子书是怎样制作的?

写这篇博客的目的是记录我制作的一本塞尔维亚语小说,并将其通过免数据线的无线传输方式上传到Kindle里阅读的过程。

整个过程需要用到的设备有。 Kindle Paperwhite 3 一台,Windows 10电脑一台,网络服务器一台。用到的软件比较多,我会在下文一一描述并提供参考链接。

最近需要学一门小语种的外语,塞尔维亚语。看小说当然是一个学习语言的好办法。当然,小说也必须是当代流行小说,否则看起来太枯燥。于是我以关键词 “novel bestseller in serbian language” 在Google搜索(设定记录时间为最近一年之内),得到一个巴诺图书的查询结果。点击打开如下页面:https://www.barnesandnoble.com/b/books/_/N-1z12qpoZ29Z8q8 在这个页面上点击其中一本书 Dervis i smrt https://www.barnesandnoble.com/w/dervis-i-smrt-mesa-selimovic/1122494269 。现在我将为这本书制作一个自己专用的mobi格式以便放进Kindle里阅读。

在制作图书之前,我已经将我的Kindle Paperwhite 3 越狱并安装了 USBNetwork 无线管理器(Kindle越狱和安装软件可以参考书伴的这篇文章:《USBNetwork Hack 安装教程:无线管理 Kindle 文件》 )。USBNetwork 可以让我们通过 WiFi 直接连接到 Kindle 并对其进行传送文件、管理等操作,就像管理 FTP 一样,这样就可避免为了管理文件反复在 Kindle 上插拔 USB 数据线。 有了这个软件,我可以直接用电脑通过SSH连接Kindle的22端口,进入到Kindle内部的文件夹。我设定的默认连接目录是 /mnt/us/documents/Downloads ,我将把自己制作的电子书都放进这个目录里。

由于很多小语种的电子书都只有PDF的资源,所以,现在我用书名 “Dervis i smrt PDF” 这个关键词在Google搜索,得到一本PDF格式的电子书。现在我需要将其变更为适合Kindle的6英寸墨水屏阅读的标准mobi格式。

我先将文件名更改为更加简单的纯英文或英文数字组合(不能包含中文或特殊字符),再将PDF文件在Infix PDF Editor这个软件中打开,并导出为HTML4格式的网页。这里要说的是由于小语种的问题,直接将PDF在Infix PDF Editor中导出为epub格式可能会遇到乱码问题,导出为HTML4更为稳妥些,这也是我为什么不直接将PDF导出为epub格式的原因。导出之前需要对导出文件的内容和格式做一些设置。我的设置如下:

导出的时间由文件大小决定,我这本书花了不到两分钟的样子。这样就得到了一个html格式的文件(如果有图片则会集中存放在一个文件夹中),打开检查可以发现PDF格式多余的折行问题在HTML文件里都已经解决了。但是还有一个问题,PDF文件的页码和分页符都被保留在HTML页面内,我需要将它们去掉。

现在,用Notepad++打开HTML文件,将页面HTML源代码copy出来,在Google中搜索一个HTML美化的网站,比如这个:https://uutool.cn/format-html/ ,将源代码粘贴进去,点击美化,然后将美化后的源代码替换掉自己生成的HTML文件的源代码,保存。

接下来,先删除分页符。在本例中分页符是用

<HR>

表示的,这很简单,直接用Notepad++的替换功能将这个代码批量替换为空即可。有的PDF文件每一页的页脚还带有页码(本例中没有),如有的话,需要用到正则表达式来替换。替换方法是将

<FONT COLOR="#ff4200">10</FONT>

这样的代码中的数字更换为(\d+),这个正则表的是的意思是匹配一个以上的数字字符。将

<FONT COLOR="#ff4200">(\d+)</FONT>

批量替换成空,然后保存页面。于是所有的页码就消失了,完美的HTML页面制作完成。

现在将页面文件(含图片)上传到服务器任意目录下,并在浏览器打开这个网页。现在需要用到EpubPress这个Chrome浏览器扩展,安装了这个扩展之后,点击它,在Title和Description输入电子书的书名以及描述,选中目标页面,点击下载,接下来这个扩展将会把页面打包成一个标准的Epub格式的电子书,制作的电子书质量相当高。电子书制作完毕会直接下载到电脑的下载目录。

现在将这个电子书Dervis i smrt.epub的后缀名由epub更改为zip,然后解压,获得一个Dervis i smrt文件夹,进入文件夹Dervis i smrt\OEBPF\images,找到一张图cover.png,这是EpubPress自动生成的电子书封面,我们需要将这张图换成自己设计好的封面。现在回到最开始的页面https://www.barnesandnoble.com/w/dervis-i-smrt-mesa-selimovic/1122494269 ,下载这本书的封面图,在photoshop中将其大小改为1004x1540像素,然后保存其为cover.png,并替换到Dervis i smrt\OEBPF\images这个文件夹下。

现在来到Dervis i smrt根目录,运行winrar压缩这个文件夹为 Dervis i smrt.zip,然后将压缩包的后缀名zip改成epub,至此,一个有着漂亮封面的epub电子书制作完毕。

由于我的阅读设备是kindle我还需要将这个epub格式的电子书转换成Kindle支持的mobi格式。虽然我的kindle已经越狱并安装了KOReader,是可以直接阅读epub格式的电子书的,但epub格式的书在kindle里不显示封面图,我这样的强迫症患者怎么能够忍受在书架上的书没有封面图呢?

所以,我打开我的电子书管理工具Calibre,导入Dervis i smrt.epub,将其转换成mobi格式,然后在书籍目录中将Dervis i smrt.mobi这本书复制出来。

由于我不希望用数据线连接电脑和Kindle,如上文所述,我想用 USBNetwork 来传输电子书到Kindle里,所以,我打开Bitvise SSH Client(WinSCP也行),通过wifi连接上kindle,将电脑上的Dervis i smrt.mobi发送到Kindle的/mnt/us/documents/Downloads目录中。这样上传的书籍是没有封面的,虽然直接用Calibre将电子书导入Kindle可以实现封面展示,但要用到数据线,我不喜欢。所以,麻烦就麻烦点吧,我接下来要把这本书对应的封面传到Kindle里,并与原书匹配上。

打开电子书元数据提取软件MobiMetaEditorV0.16.jar(需提前安装好java运行环境),选择Dervis i smrt.mobi这本书,可以查看该书的ASIN值是e11be5c2-4779-4996-bafb-ac122abf2efd,记住这个值。

在photoshop中打开刚才制作的cover.png,将其大小变更为325x500像素,然后将图片名命名为thumbnail_e11be5c2-4779-4996-bafb-ac122abf2efd_EBOK_portrait.jpg,保存到本地,图片名字里的一长串代码就是刚才得到的ASIN号码。

现在,再次用USBNetwork连接Kindle,进入/mnt/us/system/thumbnails这个目录,将thumbnail_e11be5c2-4779-4996-bafb-ac122abf2efd_EBOK_portrait.jpg上传进去,如Amazon已经为其自动生成了一张同名的空白图,则替换之。现在在Kindle的书架上,我制作的电子书已经有了漂亮的封面了。

下面是书籍打开之后的阅读页面:

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注