Celia Valdeolmillos on Nostr: MarkItDown es una herramienta desarrollada en Python para pasar diversos tipos de ...
MarkItDown es una herramienta desarrollada en Python para pasar diversos tipos de archivos y documentos de Office a #markdown .
Entre otros, convierte PDFs, archivos de word, powerpoint y excel. También distintos datos de imágenes (EXIF y OCR), y audio (datos EXIF, y también transcripciones del habla). Además, pasa HTML a Markdown, con gestión especial para la wikipedia.
Y por supuesto, es #opensource . Aquí su GitHub.
https://github.com/microsoft/markitdown
Entre otros, convierte PDFs, archivos de word, powerpoint y excel. También distintos datos de imágenes (EXIF y OCR), y audio (datos EXIF, y también transcripciones del habla). Además, pasa HTML a Markdown, con gestión especial para la wikipedia.
Y por supuesto, es #opensource . Aquí su GitHub.
https://github.com/microsoft/markitdown