Convertir documentos de Markdown en formato de Microsoft Word

Convertir documentos de Markdown en formato de Microsoft Word
Entre otras actividades, escribir y editar documentos de texto pertenece a las acciones más comunes que utilizamos nuestras computadoras (de escritorio) para. La forma exacta en que se realiza sigue diferentes rutas, desde el uso de un editor de texto desnudo como VIM hasta aplicaciones gráficas como Open/Libre Office o servicios basados ​​en la nube a los que se puede acceder a través de WebBrowser como Google Docs. Para nuestra desventaja, cada herramienta viene con su propio formato de documento nativo, así como la selección de otros formatos de documentos compatibles. La calidad de la conversión entre estos formatos varía ampliamente y puede provocar mucha frustración al cruzar los límites del formato.

En este artículo, echamos un vistazo a la conversión entre Markdown [1] y DOCX: el formato de documento nativo de Microsoft Word que está en uso desde 2007. Quizás se pregunte por qué un entusiasta de Markdown y Asciidoc (como yo) trata de este caso. Bueno, la colaboración con un grupo de otros escritores puede conducir a una situación, mientras que uno o más participantes solicitan DOCX como formato de salida. No defraude a nadie y descubra qué limitaciones existen, en su lugar y cómo podemos tratar de hacer felices a todos los miembros del grupo.

¿Qué es Markdown??

Como ya se señaló en "Una introducción en Markdown" [2], la intención de Markdown es un texto simple para la conversión HTML. La idea detrás de esto era hacer que la escritura de páginas web, la documentación y especialmente las entradas de blog sean tan fáciles como escribir un correo electrónico. A partir de hoy es el sinónimo de facto para una clase de lenguajes de descripción de marcado liviano, y el objetivo puede verse como se alcanza.

Markdown utiliza una sintaxis de formato de texto sin formato. Con un enfoque similar al HTML, varios marcadores indican titulares, listas, imágenes y referencias en su texto. Las pocas líneas a continuación ilustran un documento básico que contiene dos titulares (primer y segundo nivel), así como dos párrafos, y un entorno de lista.
# Lugares recomendados para visitar en Europa
## Francia
Esta es una selección de lugares:
* París (_ile de France_)
* Estrasburgo (_alsace_)
Para un plan de visita adecuado aproximadamente una semana.

Conversión a Docx

Para convertir su documento de Markdown en DOCX, use la herramienta PANDOC [3]. Pandoc es una biblioteca de Haskell y se describe a sí misma como "el convertidor de documentos universal", o la "navaja suiza para conversiones de documentos". Está disponible para una variedad de plataformas como Linux, Microsoft Windows, Mac OS X y BSD. PANDOC se incluye comúnmente como un paquete para distribuciones de Linux como Debian Gnu/Linux, Ubuntu y Centos.

Un llamado simple para una conversión es el siguiente:

Prueba de $ pandoc -o.prueba DOCX.Maryland

El primer parámetro '-o' se refiere al archivo de salida, seguido del nombre del archivo ('prueba.docx '). La extensión del archivo ayuda a PandoC a identificar el formato de salida deseado. El segundo parámetro nombra el archivo de entrada: en nuestro caso es simplemente 'prueba.Maryland'.

La versión larga del comando que se muestra arriba contiene los dos parámetros'f Markdown 'y' -t Docx '. El primero abrevia el término 'sabor' y describe el formato del archivo de entrada. El segundo hace lo mismo para el archivo de salida y abreviatura '-to'.

El comando completo es el siguiente:

Prueba de $ pandoc -o.DOCX -F MARKDOWN -T DOCX Test.Maryland

Abrir el archivo convertido usando Microsoft Word da como resultado la siguiente salida:

Para los diferentes elementos de texto, Pandoc usa hojas de estilo. Esto le permite ajustar estos elementos más tarde de acuerdo con sus necesidades en todo el documento. Las versiones más nuevas de PANDOC también ofrecen al revés: puede convertir un archivo DOCX en Markdown de la siguiente manera:

Prueba de $ pandoc -o.prueba de MD.dogx

Luego, el archivo generado tiene el siguiente contenido:

Lugares recomendados para visitar en Europa
=======================================
Francia
------
Esta es una selección de lugares:
- París (*Ile de France*)
- Estrasburgo (*Alsacia*)
Para un plan de visita adecuado aproximadamente una semana.

Opciones de línea de comandos útiles

La lista de opciones de Pandoc es bastante larga. Los siguientes lo ayudan a producir mejores resultados y facilitar su vida:

* '-P' (versión larga '-eserve-tabs'): preservar las pestañas en lugar de convertirlas en espacios. Esto es útil para bloques de código con líneas con sangría que forman parte de su texto.

* '-S' (versión larga '-smart'): producir una salida tipográfica correcta.

Esta opción corrige citas, guiones/guiones, así como elipses ("..."). Se agregan espacios adicionales no rompientes después de ciertas abreviaturas como "Sr.".

* '-track-changes = value': especifica qué hacer con las inserciones, deleciones y comentarios que se producen con la ayuda de la función de Microsoft Word "Track Changes". El valor puede ser aceptado, rechazado o todo para incluir o eliminar los cambios realizados en el documento. El resultado es un archivo plano.

Para obtener más opciones, eche un vistazo a la documentación y la página manual de Pandoc.

Resumen

La conversión entre Markdown y Docx ya no es un misterio. Se hace en unos pocos pasos y funciona muy bien. Feliz piratería 🙂

Enlaces y referencias

* [1] Markdown
* [2] Frank Hofmann: Introducción a Markdown
* [3] Pandoc

Agradecimientos

La autora desea agradecer a Annette Kalbow por su ayuda mientras prepara el artículo.