Usuario discusión:Ignacio Rodríguez

De Wikisource, la biblioteca libre.
Ir a la navegación Ir a la búsqueda
Archivos: 2014  • 2015  • 2016  • 2017  • 2018  • 2019  •

Bots: wikisourcetext[editar]

He intentado usar wikisourcetext.py pero no consigo hacerlo funcionar, siempre me da error en el parámetro index, por ejemplo python3 pwb.py wikisourcetext -index:"Julio_César_(1921).djvu" -pages:73-80 -ocr:googleOCR, que estaré haciendo mal? Shooke (discusión) 18:17 3 jul 2020 (UTC)

Simplemente hay que agregarle a -index:"Index:blablabla..." Lo probé con el resto de tu código y me funcionó. No conocía bien este bot, yo lo bueno es que le agrega el encabezado por defecto! Genial. --Ninovolador (discusión) 20:43 3 jul 2020 (UTC)
Si probé con eso también, pero no me funcionó, debe haber algo mal en mi instalación de pywikibot. Estoy empezando a usar el bot para corregir las transcripciones, automatizar reemplazos, me sirvió mucho la experiencia de reemplazar tag center obsoleto, se puede dar una pasada o varias pasadas para corregir, y asi alivianar la corrección final de las transcripciones. Estoy pensando en hacer un script especial para eso y usar otras librerías de python. Saludos Shooke (discusión) 21:25 3 jul 2020 (UTC)
La idea es un script que reconozca por ocr, y se pongan directivas de reemplazo, y se genere automaticamente por tandas, un texto que tenga las minimas correcciones por realizar, por ejemplo aquí aprovecho que los nombres del encabezado de los personajes está en mayúscula y entre dos \n y ahi es donde reemplazo con el otro script. Y el texto resulta bastante aceptable. Shooke (discusión) 21:40 3 jul 2020 (UTC)
@Shooke: A mí lo que me ha resultado más óptimo es Usuario:Ninovolador/NinoTools.js que es similar a las herramientas de transcripción que ya tenemos, pero personalizado para las distintas transcripciones que he hecho. La última la usé con El jardín de los cerezos, por ejemplo, y apretando dos teclas, generaba el formato completo. Como la transcripción de Google venía casi lista, el flujo de trabajo era sumamente rápido!. Le puedes echar un vistazo si quieres. --Ninovolador (discusión) 22:01 3 jul 2020 (UTC)
Muy bueno! claro, algo asi, hecho en python, pero para bot. Porque se puede contrastar con páginas de gutenberg, que indican numero de pagina, en el caso de tener ediciones iguales Shooke (discusión) 22:22 3 jul 2020 (UTC)

The Signpost: 2 August 2020[editar]

Plantilla de modernizacion desde el índice[editar]

Agregué esto, para ver si podemos poner una opción que agregue automáticamente la plantilla de modernización en el header, y de paso que ponga un mensaje que el texto respeta la ortografía original, habría que buscar una forma de que seleccione a través de un listbox, saludos Shooke (discusión) 14:34 3 ago 2020 (UTC)

@Shooke:Hecho Hecho acá y acá --Ignacio Rodríguez (discusión) 15:05 3 ago 2020 (UTC)

Icp y algunas características[editar]

Me encontré con esto, y estaba pensando en alguna opción para situar texto en el medio de los puntos, para no tener que alinear manualmente, y que no dependa del font. Shooke (discusión) 13:44 18 ago 2020 (UTC)

@Shooke: creo que es fácil. No sé si quede exactamente igual, pero decente sin duda. Mira el último ejemplo en Módulo:ICP/pruebas --Ignacio Rodríguez - δ -- contr. 23:41 18 ago 2020 (UTC)

The Signpost: 30 August 2020[editar]

Problemas con poem[editar]

Tengo hace rato, este problema con los poemas Página:La vuelta de Martin Fierro - Jose Hernandez (2ed).pdf/45 cuando inserto una plantilal de centrar o una línea, me agrega un caracter de retorno demás, que será? saludos Shooke (discusión) 17:59 30 ago 2020 (UTC)

Ahi me di cuenta que lo tengo qeu dejar fuera de los tags poem, dentro de los poem trae probelmas Shooke (discusión) 22:02 30 ago 2020 (UTC)

Libros de Márquez[editar]

justo ayer cargue este y otro más en Commons, uno es volumen 2 y el otro volumen 4, segun Google, pero no me quedó claro, ademas, no ma habia dado cuenta que uno de ellos lo habias cargado antes como vol II, que en google dice vol. 4, en fin, cual te parece transcribir? El ocr lo voy a importar de gutenberg via bot. Saludos Shooke (discusión) 19:20 1 sep 2020 (UTC)

@Shooke: había olvidado que había cargado esa copia antes. La verdad me trae sin cuidado, haz como gustes!. Supongo que le puse II porque ya existía otro archivo con el mismo nombre, pero no averigüé que era parte de la misma colección. Adelante! --Ignacio Rodríguez - δ -- contr. 19:27 1 sep 2020 (UTC)
Si yo también lo había visto antes, pero me olvide tambien de ese archivo, ok, igualmente, el ocr va a venir ya prácticamente transcripto de guenberg, que está marcado por páginas tambien, lo que facilita que practicamente lo pueda convertir todo. Cuando tenga listo el script, te lo mando, para que veas lo sencillo que puede ser importar desde ahi Shooke (discusión) 19:31 1 sep 2020 (UTC)
Excelente! Podrías subirlo a github o incluso acá mismo, para disfrute de todos! --Ignacio Rodríguez - δ -- contr. 19:34 1 sep 2020 (UTC)
Todavia estoy puliendolo al algoritmo, hay bastntes variables para considerar, pero agiliza un montón Shooke (discusión) 20:46 9 sep 2020 (UTC)

Enlaces automáticos[editar]

¡Gracias por tu ayuda! Era bastante tedioso ir capítulo por capítulo haciendo eso jaja. Saludos. --Carlos yo (UA) (discusión) 18:32 9 sep 2020 (UTC)

Plantilla línea[editar]

De momento, no se renderiza la plantilla {{línea}}, no se a que se ha debido, porque no hubo cambios ni en el módulo lua, ni en el css, habrá algun cambio en mediawiki? Shooke (discusión) 12:50 10 sep 2020 (UTC)

@Shooke: Lo están viendo en phab:T262507. --Ignacio Rodríguez - δ -- contr. 14:12 10 sep 2020 (UTC)
Me parecía! Shooke (discusión) 14:13 10 sep 2020 (UTC)