My HTML to eReader process…

I’ve always tried to find the best way to move things from the Web/Computer to my eReader. I have an old eBook reader from BeBook and I always searched for the best workflow to have my stuff always with me in the BeBook. I have been asking for a HTML2ePub plugin or a Save As ePub option  in browsers for sometime, but until that day comes here is how to convert webpages to PDF for the ebook.

My first option was/is Calibre to do conversions. It uses recipes tailored for each website you want to download and converts them to the format you want (ePub, mobi, pdf, etc…). It’s easy, but you need to configure recipes and if the website doesn’t provide an RSS feed you have to code a lot in python.

My most recent approach is a little bit more elaborate, but I think the results are even better. It’s a multiple step process that involves different tools, but gets you wonderful reading experiences in the eBook reader. PDF, yes… I convert everything to PDF. But wait, there’s a trick. Here is how I do it:

1) Install the Readability bookmark/addon for your browser. Readability converts any webpage into a very beautiful and easy to read version.

2) Configure a page format in the printers preferences. Call it “BeBook”. The BeBook screen is 6” (9cm x 12cm) but I found that a page with 14cm x 17cm works best.

3) Print the Readability version of the webpage to a PDF file with this special page size.

4) As this PDF has some white margins (something that is totally nonsense for eBook readers) use Adobe Acrobat Pro to crop all white margins from the PDF file.

The final version reads perfectly in the eReader. The number os words per line is perfect and the font size is also great. The BeBook has two PDF rendering engines: Adobe and XPDF. While the first is more elegant, the second is much faster, but both engines produce great results. If you don’t like the pdf format you can then convert the pdf to epub.

HTML2ePub – We need a Browser plugin.

There are several ways to convert documents to the ePub format. One of my favorites is the using calibre, that has excellent command line tools than can automate the process.

But on the browser front, there’s nothing that I’m aware of. What I’d like to have was the option to “Save this page as ePub“! Sometimes I just want to save the webpage in a file for latter reader in my eBook reader. Already searched for something like this in Firefox extensions repository, but nothing came up. My ebook reader can read HTML files, but I’d really like them converted to ePub as this would allow cleaning of all junk information.

Also interesting would to use the Readability technology to then produce the epub. Does anyone know anything that can do this?

Dia mundial do livro (electrónico?)

Cartaz Feira do Livro Madrid

Cartaz Feira do Livro Madrid a começar a 28 de Maio

Hoje celebra-se o dia mundial do livro e do direito de autor. Acontece que este dia não tem muitos motivos para festejar. Não que haja problemas com a parte “Dia Mundial do Livro”, mas antes com a parte “direito de autor”. Quando em 1995 a UNESCO fundou este dia, estávamos numa época onde a Web dava os primeiros passos, a aldeia global não mais era do que um conjunto de universidades e uns quantos malucos pendurados em modems de 14400 bauds – hm… 95 seria talvez um motorola 33.6Kbps, mas adiante.

O dia mundial do livro devia ser positivamente desacoplado desta fantasia que é o direito de autor (nos termos da actual generalidade das leis sobre a matéria). O livro, que com o Kindle e mais recentemente com o iPad adquiriu o estatuto de pleno direito nos formatos electrónicos, não merece estar preso a peias de legislações ultrapassadas.

Veja-se o quão actual está esta apresentação de Larry Lessig nas Ted Talks de 2007. O direito de autor é uma questão ao nível do direito de propriedade e como Lessig explica, está neste momento a prejudicar a inovação, a criatividade e no fundo a beleza de viver no mundo do século XXI.

O Livro. A ideia do local onde a imaginação vai para lá da realidade, onde tudo é possível e onde não há fronteiras está infelizmente associada neste dia com a ideia de uma visão de propriedade intelectual que muito deixa a desejar numa sociedade moderna e de futuro. A primeira década do século XXI foi a década da perseguição e do esmagar da criatividade. Esperemos que os próximos 10 anos sejam os da abertura e inovação.

A propósito, já leu um livro hoje?

As minhas últimas aquisições para comemorar o dia do livro aqui no sixhat pirate parts:

Lakatos, Imre – História da Ciência e Suas Reconstruções Racionais.
Lakatos, Imre – Falsificação e Metodologia dos Programas de Investigação Científica.

Como Converter PDF para e-Book Reader

Apesar dos e-Book Readers aceitarem imensos formatos (doc, rtf, pdf, mobi, prc, pdb, wolf, ,pdf, epub, etc…), as reduzidas dimensões do ecrã e-ink criam problemas com os PDF. Parece não haver consenso sobre a utilização dos e-Book e-Readers para ler PDFs. Um dizem que dá, outros que nem por isso… pelo que decidi explorar as possibilidades de conversão de PDF para e-book readers.

Uma solução conveniente para converter os pdf para formato e-book passa pela utilização do calibre. O Calibre é muito mais que um conversor. É todo um sistema de gestão de ebooks e de subscrições de jornais online, mas as suas funções de conversão são excelentes e permitem facilmente converter pdf para e-book. Quem quer utilizar livros electrónicos deve ter este canivete Suíço por perto.

O PDF é produzido para impressão final e normalmente o tamanho da página é muito diferente do tamanho dos ecrãs dos eBook Readers. Enquanto o PDF é normalmente feitos para A4 ou letter, os ecrãs de 6” com 800×600 pixeis normalmente tem 9×12 cm. Esta medida faz com que ler o pdf seja complicado, uma vez que o redimensionamento vai tornar as letras muito pequenas. Um outro problema do ficheiro pdf são as margens. O espaço extra que no papel é útil, no eBook Reader é ecrã desperdiçado.

A solução ideal é ter uma cerveja e um martelo preparar o PDF exclusivamente para o ecrã dos eBook Readers, ou seja, quando se produz os documentos para estes dispositivos o ideal é configurar o documento para uma página de 9×12 cm. As margens devem ser mínimas uma vez que nestes dispositivo não são necessárias (normalmente 0,2 cm é mais que suficiente). Re-imprimir o documento nem sempre é possível e só temos o PDF para reajustar. Nesta situação há apenas duas coisas que fazem sentido. Uma é fazer o crop do ficheiro PDF para que as margens desapareçam (80% dos pdf) . A outra é fazer o reflow do documento. Isto implica rearranjar o documento para o eBook Reader.

Uma solução que permite fazer de certa forma as duas é utilizar o Adobe Acrobat Pro que permite fazer o crop e o reflow… o reflow… hm… pois.

Embora tecnicamente o Adobe Acrobat Pro faça o reflow para visualização no ecrã do computador, não permite exportar no formato reflow. Contudo o Adobe Acrobat Pro permite fazer outra coisa que é exportar o PDF para outro formato, seja TEXTO, RTF, XML, Word ou HTML. Isto permite que o texto seja lido no e-Book Reader sem problemas. Até ao momento a solução que tenho adoptado é a exportação para RTF que funciona muito bem. Para os casos em que exporto em HTML também é possível converter o HTML para ePub

O grande defeito da utilização do Adobe Acrobat Pro é que é caro. Mas há uma solução gratuita… embora só para Windows, que é utilizar o Mobipocket Creator (já não disponível). Ao instalar pode-se optar pela versão home ou publisher e nesta última é possível importar documentos PDF para serem transformados em formato MOBI (.prc ou .mobi). A vantagem do formato .mobi é que neste momento para além do formato kindle, a amazon (a dona do mobipocket) só vende também livros em formato MOBI.

Para quem quiser ser masoquista converter o PDF para HTML existe um utilitário PDF to Html que permite fazer a conversão. Outra solução para converter Pdf em Html é utilizar um serviço online que converte pdf para html. E também é possível converter html para pdf.

Conversores de PDFs online

Para além das aplicações desktop para conversão de PDFs, também há versões online que fazem a conversão para e-book. Eis alguns dos sites que prometem converter pdfs para e-books.

Os resultados das conversões para e-book são variados, mas vale a pena tentar os serviços antes de começar a instalar conversores no computador.