Audio Captcha

audio-captcha

Un captcha es uno de esos desafíos con palabras o letras distorsionadas que hay que reproducir sobre un cuadro de texto. El objetivo de los captcha es evitar que un programa pueda realizar automáticamente una determinada tarea, y que tenga que mediar la intervención humana en una parte del proceso. Esto especialmente útil para evitar el envío automático de información o el registro de usuarios en un determinado sistema, casi siempre con fines de spam.

Un problema de los captchas es el de las personas que no pueden ver. Para ellos ya es bastante complicado el navegar por Internet, como para encima encontrarse con un problema de este tipo. Un ciego no puede resolver un captcha y no existen programas que les faciliten la vida, pues en tal caso serían empleados por los distribuidores de spam, para saltarse la protección directamente.

La solución pasa por los captchas de audio que son un fichero de sonido que sirve como alternativa a la detección de las palabras escritas. Normalmente uno tiene la elección entre un sistema u otro (en Estados Unidos hay leyes que exigen que el sistema sea apto para personas con minusvalías visuales) aunque lo normal es emplear el sistema de las palabras distorsionadas.

Sin embargo, si alguna vez has oído un captcha te habrás dado cuenta de que es un verdadero galimatías. Los captcha de audio son mucho más difíciles de resolver que los de texto. Se estima que la tasa de acierto de los captchas de audio es inferior al 50%.

En la pantalla de arriba, vemos dos captchas ofrecidos por ReCaptcha. El de texto te exige introducir dos palabras sencillas. Pero el de audio te muestra una secuencia de ocho cifras que hay que distinguir entre un considerable ruido de fondo.

Para colmo de males, los captcha de audio son más fáciles de resolver por las máquinas que los captchas de texto. Gran parte de la dificultad estriba en que los sistemas de audio captcha están mucho menos desarrollados.

En muchos casos sólo hay que enunciar una serie de cifras (ocho en el caso de recaptcha) con lo que resulta mucho más fácil de trazar para una máquina que todas las combinaciones de letras, con la doble opción de mayúsculas y minúsculas. Además, los sonidos están pregrabados, con lo que no sólo hay que perseguir una serie de cifras, sino en unas interpretaciones limitadas y concretas.

Verdaderamente estamos ante un reto tecnológico considerable. Cualquier movimiento hacia dificultar la tarea de los spammers convierte la experiencia de los usuarios ciegos en una pesadilla, pues ya la situación actual es casi intolerable.

Una posible solución sería que el captcha de audio formulara una pregunta y el usuario tuviera que introducir no lo que ha oído, sino la respuesta a dicha pregunta. En este caso se choca con las minusvalías intelectuales, pues no hay pregunta lo suficientemente sencilla que no pueda resultar complicada para algunas personas.

En muchos casos hay además problemas de usabilidad en los formularios que dificultan el trabajo de las personas ciegas aún más. Al tratarse de un apartado marginal dentro del registro o la introducción de formularios, muchas veces el tratamiento es absolutamente superficial.

Así que amigos, la próxima vez que veáis uno de esos molestos captchas pensar que dependiérais de la versión de audio, vuestra situación sería infinitamente peor.

5 comments

  1. Se plantea un problema complicado. Conseguir un sistema de captcha alternativo y efectivo que no dependa de la vision.

    Habria que conseguir una respuestar por parte del usuario que una maquina no pueda dar.
    En captchas visuales se probo con mostrar fotografias de animales y decir de cual se trataba o de caras que mostraban un sentimiento (alegria, tristeza, seriedad), pero no se me ocurre un sistema eficaz basado en el sonido.
    Haciendo una analogia: ¿funcionaria reproducir una musica que fuera alegre, clasica, tetrica… y nosotros tendriamos que decir que sentimiento inspira? Es una maquina capaz de dar una respuesta a esto basandose en las notas, su duracion, su espaciado…

    Somos muy afortunados de ver.

  2. Una idea que se me ocurre es recurrir a la comprensión lectura que tiene la persona (en este caso, el ciego) y de la cual carece la máquina. Para ello, habría que programar un captcha diferente para cada entrada, que hiciera la locución (empleando un programa tipo Loquendo) de una serie de palabras, de las cuales sólo una tuviera que ver con el texto. Por ejemplo, el captcha «hablado» de esta entrada podría ser:

    1. cojos 2. diabéticos 3. mancos 4. tísicos 5. invidentes 6. lisiados 7. sordos 8. parapléjicos.

    La respuesta correcta sería, pues, la cinco. Una máquina no tendría forma (sencilla) de averiguarlo, puesto que no has mencionado la palabra «invidente» en todo el texto.

    Y se supone que si quieres hacer un comentario a un artículo, tendrás la suficiente capacidad intelectual como para resolver un acertijo de este tipo.

    [Comentario zrubavel: Esta opción me parece difícil porque por ejemplo en un formulario de registro no tienes texto contextual.
    Si hay un número limitado de opciones un programa puede ir probando cada una de ellas hasta obtener la respuesta correcta.
    La generación de los captchas tiene que ser más o menos automática con lo que preparar uno específico para una página es mucho trabajo.]

  3. Puestos a echarle imaginación, hace tiempo leí que había unos rudimentarios periféricos que emitían olores conectados al ordenador.

    El captcha podría funcionar preguntando el olor. ¡Funciona hasta con los sordociegos!

    Por supuesto habría que desarrollarlo más. Yo sé como hacerlo pero me reservo la información por si me surge un elevator pitch.

  4. Algunos captchas visuales son casi imposibles de resolver debido a lo «artístico» de los trazos. Pero los de audio son infames en sí mismo; no hay quien los entienda.

    He sido formador de alfabetización digital y puedo dar fe que la mayoría de personas de 60 años o más sencillamente no pueden, ni descifrar un captcha visual, pues tienen problemas de visión y no están acostumbrados a leer, ni un captcha de audio, pues tiene también problemas auditivos. Y no estoy hablando de ciegos y sordos, sino personas con algunas limitaciones en ambos sentidos, como mis padres, por ejemplo.

    @shevek: el robot podría «pescar» las instrucciones que se están enviando al generador de olores, para poder interpretar cuál es el resultado. Además, un usuario podría interpretar que el olor que percibe es «bareback en el campo» y el sistema esperar que le diga «merienda en la pradera». El olfato es el peor desarrollado de nuestros sentidos.

    Para evitar el spam, yo propongo una ley absolutamente implacable con los spammers, que debe ser adoptada por absolutamente todos los países: Los artífices del spam serán exhibidos atados y desnudos durante tres días en la plaza de los pueblos donde han sido vistos sus anuncios. Tres días en cada uno de los pueblos. Y los habitantes de esos pueblos (hay que poner unos captchas en los accesos a las plazas para evitar que los forasteros tengan acceso al reo) tienen derecho a hacerles cualquier cosa que quieran, siempre y cuando no queden secuelas físicas, ya que el spammer ha de estar en buenas condiciones físicas para su penitencia en el siguiente pueblo.

    Una modificación posterior de la ley podría recoger excepciones a lo de no poder dejar secuelas físicas cuando el motivo de la penitencia sea afirmar que el intercambio de archivos es un robo.

  5. Efectivamente, los captchas de audio se están volviendo bastante inusables. Soy ciego y llevo usando los captchas de audio desde hace mucho, y el gran error que les encuentro, es que intentan aumentar su nivel de dificultad creyendo que entre más ruido de fondo y mayor distorsión se haya en las palabras será más difícil de descifrar. Al caso, se vuelve más difícil, pero para los humanos, las máquinas siguen pudiendo hacer su trabajo. Hace un par de años ReCaptcha tenía un audio muy entendible, solo eran número en inglés, me parece (he estado visitando algunas webs donde ellos dan el servicio), que ahora son palabras, totalmente indescifrables, en inglés; con lo que ahora hay una nueva barrera en el idioma…

    Imagino que el éxito de un buen sistema de captcha es algo que proporcione respuestas dinámicamente y que sea difícil de que se escoja la misma respuesta de forma seguida, es decir, que no pueda haber la probabilidad de que una respuesta pueda ser seleccionada un par de veces; si se incrementan las posibles respuestas será más difícil que al seleccionar una aleatoriamente, se repita. Hay sistemas de captcha que ya se bloquean cuando hay un número de intentos sin éxito, y finalmente, están los captchas matemáticos, que te preguntan por el resultado de una operación (no son específicamente de audio, pero sí son inclusivos)… todos ellos tienen problemas, actualmente creo que no hay un sistema que sea completamente accesible para ciegos y efectivo contra spam.

    Saludos.

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *