VideoSubFinder + Abbyy

Otro método para la extracción de subtítulos

Responder
mifune
 
Mensajes: 7299
Registrado: 02 Oct 2012 20:48
Ubicación: Welcome to the Jungle
Agradecido : 10325 veces
Agradecimiento recibido: 11780 veces

VideoSubFinder + Abbyy

Mensaje por mifune » 02 Ago 2013 15:03

Dar las gracias a la compañera Loba esteparia que ha hecho posible este tutorial. Yo no fui capaz de hacer funcionar el programa y me olvidé de él. Buscando en su día algo para extraer subtítulos de una forma mas sencilla que hasta ahora, di con este programa diseñado por gente de Rusia, se lo envié a unos cuantos compañeros y no eramos capaces de usarlo o bien daba errores. Hasta que después de muchos meses y perdida la esperanza, recibí respuesta de nuestra maravillosa compañera.

Sin ser la solución a nuestros males, ni la panacea en la extracción, el resultado de mis experimentos y mi opinión es la siguiente:

El proceso es mas lento, pero la automatización en el reconocimiento de los carácteres me parece mejor que la del subrip o el avisubdetector y con los ajustes de serie resulta suficiente, al menos para mis propositos, tener generados los tiempos y a pesar de tardar más, de momento el trabajo realizado por mi, ha sido inferior al que necesito con otros programas.

Por lo que yo he indagado, el programa está desarrollado para extraer subtitulos de anime, en los que se obtiene un porcentaje de éxito muy elevado, para nuestros VHSRip pues la cosa no funciona tan bien, pero resulta especialmente útil para la generación de tiempos y su ajuste posterior con subtitle workshop o Subtitle Edit. El programa VideoSubFinder requiere de otro, llamado Abbyy, necesario para el reconocimiento OCR de los subtítulos. Toda ayuda o experiencia con estos programas es bienvenida, ya que a pesar de este tutorial nuestro conocimiento del programa es mas bien escaso.
Tutorial
Una vez descargados los programas en nuestro ordenador, abrimos el VideoSubFinder (la extensión .exe) y nos vamos a file, open video all deafault. Después de cargar el video, apretamos el botón Clear folders, eso borrará cualquier trabajo de nuestras carpetas para evitar que se mezclen las imágenes de proyectos anteriores.
Imagen
A la izquierda se nos carga la pelicula, y en los extremos tenemos unas marcas que nos sirven para definir que parte de la imagen queremos que nos reconozca. Es conveniente buscar una imagen con subtítulos de dos lineas para un mejor ajuste. Una vez seleccionada el área a explorar, pinchamos Run search y el programa empezará a "escanear" las imágenes.
Imagen

Después de unos instantes deberiamos tener lo siguiente.
Imagen
Si tarda mucho, mucho, puede que haya alguna incompatibilidad en los codecs, solo me ha pasado una vez, recodifique el archivo y me reconoció la película. En el cuadro de la derecha vemos un recuadro con marcas blancas, pues cuanto mas blanco se vea ahí, mejor será el resultado final.
Imagen
Una vez analizado el archivo, tarda un rato, podéis hacer otras cosas mientras.

Vamos a la pestaña OCR y seleccionamos "Create cleared TXT Images", eso va a convertir nuestras imágenes anteriores a un formato reconocible para el programa Abbyy. Otro ratito de espera.
Imagen
Una vez terminado el análisis y sin cerrar el VideoSubFinder, usamos el programa Abbyy. En la carpeta TXTImages del VideoSubFinder están las imágenes que nos interesan, las seleccionamos (yo tengo que hacerlo en varias veces ya que no me deja seleccionar todas las imágenes de golpe, puede que por problemas de memoria RAM) pulsamos donde pone leer, y el programa empieza a reconocer los archivos. Una vez hecho se pueden modificar en el Abbyy los resultados y guardarlos, o bien guardarlos directamente tal como hayan quedado para una edición posterior con programas creados a tal efecto (1).
Imagen
IMPORTANTE: En Abbyy, id a herramientas/opciones/ pestaña TXT/ codificación>>>MARCAD SELECCION AUTOMATICA.

Una vez hecho esto, guardad los archivos, como documento de texto en la carpeta TXTResults del VideoSubFinder y en las opciones de archivo seleccionamos> "nombrar archivos como imagen de origen". Una vez hecho esto vamos al VideoSubFinder y en la pestaña OCR pulsamos la opcion "Create sub from TXTResults", se nos generan dos archivos, uno en formato .srt y otro en .ass (tiene bemoles la extensión). Si el reconocimiento ha sido bueno no hará falta retocar casi nada, en caso contrario tocaría realizar el ajuste (1) usando programas como el aegisub, subtitle edit o subtitle workshop para la edición definitiva.
Imagen
VideoSubFinder
Programa Abbyy parte 1
Programa Abbyy parte 2

Este es el único videotutorial que hay en castellano, de un compañero de taringa.
http://www.youtube.com/watch?v=cRcCmracUcc

Y este en ruso.
http://www.youtube.com/watch?v=VHsUfqqAkWY

Avatar de Usuario
Feve
 
Mensajes: 1397
Registrado: 13 Sep 2012 19:46
Ubicación: Dx Dy ³ h/2
Agradecido : 270 veces
Agradecimiento recibido: 294 veces

Re: VideoSubFinder + Abbyy

Mensaje por Feve » 02 Ago 2013 15:13

Muchas gracias, mifune, la verdad es que hace mucha falta un programa así, aunque no funcione bien del todo es más que bienvenido. :hi:

Avatar de Usuario
droid
Administrador del Sitio
 
Mensajes: 7559
Registrado: 12 Sep 2012 03:37
Agradecido : 3937 veces
Agradecimiento recibido: 6340 veces

Re: VideoSubFinder + Abbyy

Mensaje por droid » 02 Ago 2013 16:58

Muchas gracias por el tutorial, Mifune. :amo: :amo: :amo:

Esto es lo que le falta a Subtitle Edit, un método efectivo para extraer los subtítulos incrustados.

Saludos. :hi:

Avatar de Usuario
Feve
 
Mensajes: 1397
Registrado: 13 Sep 2012 19:46
Ubicación: Dx Dy ³ h/2
Agradecido : 270 veces
Agradecimiento recibido: 294 veces

Re: VideoSubFinder + Abbyy

Mensaje por Feve » 02 Ago 2013 19:36

Recuerdo con el Avisubdetector que fueran como fueran los subtítulos, sólo permitía extraer tiempos y llegaba a sacar hasta diez líneas para cada subtítulo!!!! Con srt de casi 10.000 líneas me he encontrado!!! Temblores me daban! :wacko2:

jajaja, pa' morirse era aquello, oiga. Se tardaba más arreglando los resultados que haciendolo todo a mano.

Veremos qué tal se porta este con una cosa así:

Imagen

Lo intento y os comento los resultados.

Avatar de Usuario
droid
Administrador del Sitio
 
Mensajes: 7559
Registrado: 12 Sep 2012 03:37
Agradecido : 3937 veces
Agradecimiento recibido: 6340 veces

Re: VideoSubFinder + Abbyy

Mensaje por droid » 02 Ago 2013 20:10

Feve escribió:
Recuerdo con el Avisubdetector que fueran como fueran los subtítulos, sólo permitía extraer tiempos y llegaba a sacar hasta diez líneas para cada subtítulo!!!! Con srt de casi 10.000 líneas me he encontrado!!! Temblores me daban! :wacko2:

jajaja, pa' morirse era aquello, oiga. Se tardaba más arreglando los resultados que haciendolo todo a mano.[...]
Y no exageráis absolutamente nada...
droid [url=http://cineforum-clasico.org/archivo/viewtopic.php?p=36547#p36547]aquí en 2006[/url] escribió: He logrado algo con el avisubdetector, aunque no todo lo que yo hubiese querido. De cada linea que he logrado que detecte se subdivide en varias lineas... supongamos que una linea tiene una duración de tres segundos quedaría así

14
00:00:12,280 --> 00:00:13,160
Los es
de pectadores la verán
sde esa doble perspectiva

15
00:00:13,160 --> 00:00:13,520
Los es
de pectadores la verán
sde esa doble perspectiva

16
00:00:13,520 --> 00:00:13,960
Los espectadores la verán
esde esa doble perspectiva

17
00:00:13,960 --> 00:00:14,480
Los es
de pectadores la verán
sde esa doble perspectiva

18
00:00:14,480 --> 00:00:14,760
Los es
de pectadores la verán
sde esa doble perspectiva

19
00:00:14,760 --> 00:00:15,120
Los es
de pectadores la verán
sde esa doble perspectiva


Deciros como curiosidad que en los 12 primeros minutos de pelicula me han salido 838 lineas..... a ese ritmo posiblemente aparezcan 5000 y pico lineas, de todos modos creo que vá a ser más comodo ir borrando lineas que ir linea por linea desde el principio sin tener ninguna referencia de tiempos, y luego habría que corregir estos fallos ortográficos que el programa no detecta en condiciones por ser un OCR experimental.

En definitiva una putada de subtitulo que espero tener antes de que termine el mes de julio (si no me pego un tiro antes).

Saludos.
afortunadamente Martinbuñuelito hizo la mitad.

Un saludo. :hi:

mifune
 
Mensajes: 7299
Registrado: 02 Oct 2012 20:48
Ubicación: Welcome to the Jungle
Agradecido : 10325 veces
Agradecimiento recibido: 11780 veces

Re: VideoSubFinder + Abbyy

Mensaje por mifune » 03 Ago 2013 01:16

En la película de la caja mágica, Avisubdetector método automático unas 4000 lineas. Video SubFinder 1200. Eso si, las lineas cortas y de calidad baja de imagen, me las suele saltar. Y también es justo decirlo, repite alguna linea, pero en lineas generales, la extracción de tiempos es mucho mejor. Y toda linea que no haya que transcribir es ganar una pequeña batalla. :drinks:

Avatar de Usuario
Juramentado
 
Mensajes: 1915
Registrado: 16 Oct 2012 20:58
Agradecido : 765 veces
Agradecimiento recibido: 1042 veces

Re: VideoSubFinder + Abbyy

Mensaje por Juramentado » 03 Ago 2013 02:00

Pues no sé, yo uso el Avisubdetector y no lo encuentro tran mal programa. Eso sí, lo uso en modo manual, introduciendo yo el texto porque normalmente son VHSrip o DVd de calidad VHS y eso hasta la fecha no hay programa que los detecte bien; y los tiempos los suele detectar bien, en mi último proyecto con este programa, los subs de Hin helgu vé, sólo he tenido que retocar los tiempos de unas 15 líneas sobre un total de trescientas y pico, y no se ha saltado ninguna línea.
Este método del Abbyy me suena haberlo visto usado para hacer OCR de subs orientales (japoneses), que con otros métodos son bastante complicados.

mifune
 
Mensajes: 7299
Registrado: 02 Oct 2012 20:48
Ubicación: Welcome to the Jungle
Agradecido : 10325 veces
Agradecimiento recibido: 11780 veces

Re: VideoSubFinder + Abbyy

Mensaje por mifune » 03 Ago 2013 11:22

El avisubdetector en modo manual, es de lo mejorcito, yo era el usaba habitualmente. el problema esta en la obtencion automatica de tiempos, que se vuelve loco.

Avatar de Usuario
Feve
 
Mensajes: 1397
Registrado: 13 Sep 2012 19:46
Ubicación: Dx Dy ³ h/2
Agradecido : 270 veces
Agradecimiento recibido: 294 veces

Re: VideoSubFinder + Abbyy

Mensaje por Feve » 09 Ago 2013 11:13

Bueno, pues he de deicr que el primer intento no me ha resultado nada, nada bien y me han salido unas capturas en negro. Quizás es que he metido la pata en algun punto o es que el tono general de gris no le ha permitido "leer" bien al programa, no sé :???:

mifune
 
Mensajes: 7299
Registrado: 02 Oct 2012 20:48
Ubicación: Welcome to the Jungle
Agradecido : 10325 veces
Agradecimiento recibido: 11780 veces

Re: VideoSubFinder + Abbyy

Mensaje por mifune » 09 Ago 2013 11:23

Las capturas en negro son el resultado del primer proceso de búsqueda, ¿te salen marcas blancas?, una vez tienes esas capturas negras debes ir a la pestaña OCR y seleccionas "Create cleared TXT images" y te transforma esas pantallas negras en caracteres que luego son reconocidos por el programa Abbyy. Y si no es eso, es algun error que aun no tengo estudiado. :(

En principio yo he probado, pelis en color con subs amarillos y pelis en blanco y negro con subs amarillos y blancos, ha conseguido leerlos, unos mejor otros peor, pero ha sido capaz de sacar los tiempos.

Responder

Volver a “Subtitulos”