HERRAMIENTA DE APOYO DE LECTURA DE
TEXTO PARA PERSONAS CON
DISCAPACIDAD VISUAL
SUPPORT TOOL FOR READING TEXT FOR VISUALLY
IMPAIRED PEOPLE
Carmen Monserrath Torres Rodríguez
Universidad Politécnica de Chiapas - México
Ángel Uriel López Fonseca
Universidad Politécnica de Chiapas - México
Norberto Urbina Brito
Universidad Politécnica de Chiapas - México
Diana Paulina Martínez Cancino
Universidad Politécnica de Chiapas - México
DOI: https://doi.org/10.37811/cl_rcm.v8i6.15557
Herramienta de apoyo de lectura de texto para personas con
discapacidad visual
Carmen Monserrath Torres Rodríguez
1
213177@ib.upchiapas.edu.mx
https://orcid.org/0009-0006-1486-8312
Universidad Politécnica de Chiapas México
Norberto Urbina Brito
nurbina@ib.upchiapas.edu.mx
https://orcid.org/0000-0002-3548-4717
Universidad Politécnica de Chiapas
México
RESUMEN
Ángel Uriel López Fonseca
213137@ib.upchiapas.edu.mx
https://orcid.org/0009-0005-8913-7429
Universidad Politécnica de Chiapas
México
Diana Paulina Martínez Cancino
dmartinez@ib.upchiapas.edu.mx
https://orcid.org/0000-0002-1087-9616
Universidad Politécnica de Chiapas
México
Las herramientas digitales desempeñan un papel cada vez más relevante en la sociedad actual, permitiendo
la automatización de tareas y ofreciendo apoyo en diversas áreas, especialmente para personas con
discapacidad. Estas herramientas pueden ser diseñadas para satisfacer necesidades específicas, facilitando
actividades que de otro modo requerirían un esfuerzo adicional. Este artículo aborda la discapacidad visual
(DV) y destaca la importancia de proporcionar herramientas tecnológicas que fomenten la autonomía de las
personas que la experimentan. Se enfoca en la tecnología de Reconocimiento Óptico de Caracteres (OCR),
la cual permite la identificación de texto en imágenes, con aplicaciones prácticas en ámbitos como el legal,
médico y policial. El proyecto propuesto busca desarrollar una herramienta de lectura accesible, adaptada a
las necesidades de personas con discapacidad visual, asegurando que su funcionalidad promueva la
independencia y la inclusión.
Palabras clave: inclusión, software, herramienta, OCR
1
Autor Principal
Correspondencia: 213177@ib.upchiapas.edu.mx
pág. 8588
Support tool for reading text for visually impaired people
ABSTRACT
Digital tools play an increasingly significant role in modern society, enabling task automation and
providing support across various domains, particularly for people with disabilities. These tools
can be tailored to meet specific needs, simplifying activities that might otherwise require extra
effort. This article focuses on visual impairment (DV) and emphasizes the importance o f offering
technological solutions that promote autonomy for individuals experiencing it. It highlights
Optical Character Recognition (OCR) technology, which identifies text in images, with practical
applications in fields such as legal, medical, and law enforcement. The proposed project aims to
develop an accessible reading tool, tailored to the needs of visually impaired individuals, ensuring
functionality that fosters independence and inclusion.
Key words: inclusive, software, tool, OCR
Artículo recibido 23 octubre 2024
Aceptado para publicación: 30 noviembre 2024
pág. 8589
INTRODUCCIÓN
Las herramientas digitales se encuentran cada vez más presentes en nuestro mundo actual, ayudan a cubrir
necesidades que no sabíamos que teníamos o ayudan a automatizar actividades que nunca se pensaron
serían hechas por una máquina. Pero también, en lugar de reemplazar, pueden fungir como una herramienta
de apoyo para las personas que cuentan con algún tipo de discapacidad. En ocasiones se requieren de
herramientas específicas para realizar tareas que para otras personas pueden resultar simples. Día con día
personas con discapacidad están siendo visibilizadas, han tomado más importancia en diferentes ámbitos;
sociales, políticos, económicos, y con el tiempo se han ido haciendo modificaciones en áreas de interés
para garantizar su inclusión; como puede ser en el transporte urbano o señalizaciones en lengua de señas y
braille en algunas ciudades. ( Zhizhko, 2020).
Se estima que en México existen aproximadamente 2 millones de personas con algún tipo de deficiencia
visual y al menos 400 mil de ellos tienen ceguera (Sociedad Mexicana de Oftalmología, 2023), al ser un
porcentaje pequeño en relación la población total no hay la difusión adecuada teniendo como consecuencia
que personas con DV se vean limitadas, por lo tanto, deben desarrollarse técnicas necesarias para apoyar su
autonomía en situaciones cotidianas. (Zamora & Marin, 2021).
La tecnología ha sido de ayuda en la creación de herramientas asistivas para personas con discapacidad
visual. Como en el caso de la tecnología conocida como OCR, que significa Reconocimiento Óptico de
Caracteres (del inglés Optical Character Recongnition), el cual se encarga de hacer el reconocimiento de
letras o caracteres en una imágen; sus aplicaciones son variadas y dependiendo el caso se hacen las
modificaciones adecuadas, puede ser en el aspecto legal para digitalización de documentos y predicción de
documentos (Rang, Bi, Liu, Wang, & Han, 2023), aplicaciones móviles para detección de textos (Kaur,
2018) o eliminación de ruido en procesamiento de imágenes (Mahmoud & Maghraby, 2019). Este artículo
se centrará en la DV, en la importancia de proporcionar herramientas que los apoyen en su día a día de
modo que su autonomía no se vea afectada y que la tecnología sea el principal medio para proporcionar las
técnicas necesarias. La finalidad del proyecto es la de otorgar una herramienta de apoyo de lectura de texto
usando como base OCR y demás herramientas de programación, además de recursos de tarjetas de
desarrollo en este caso la tarjeta Orange Pi Zero 2w (Orange Pi), dirigida a
pág. 8590
personas con discapacidad por lo que su uso y funcionamiento buscarán estar adecuados para
cubrir necesidades específicas sin afectar su autonomía.
MÉTODOLOGÍA
Se realizó la búsqueda de diferentes equipos y tecnologías parecidas, la realidad es que es un
trabajo de muchas personas, es una necesidad que ha existido desde hace mucho tiempo, lo que se
hizo fue una investigación para ver las semejanzas y diferencias de estos, posterior a eso se
realizó una tabla comparativa de modo que a partir de esos datos se tomaron los aspectos
favorables y realistas que cumplían con las necesidades de este proyecto.
Tabla 1. Comparación de diferentes trabajos referentes a lectura de textos usando diferentes
técnicas. (Acevedo & Morales, 2023), (Marin, 2020), (Carranza, Olivera, Garcia & Herrera,
2017), (Duran, 2013), (Lema, 2014).
CARACTERÍSTICAS
1
2
3
4
5
Aplicación de escritorio
X
X
X
X
Lectura de escritos a mano
X
X
X
X
Uso de inteligencia artificial
Uso de redes neuronales
X
X
X
Utiliza motor de búsqueda de audio
X
X
X
X
X
Identificación alfa -nurica
X
Identificación de frases completas
X
X
X
X
Procesamiento de imágenes
X
X
X
X
Siguiendo pues con el desarrollo del dispositivo se utilizaron herramientas electrónicas y de programación
como lo son: una Orange Pi 2w Zero computadora de placa única, es de código abierto donde se realizará
la carga del programa desarrollado (orange Pi, 2024); una webcam de Full HD con la característica de
autoenfoque equipada con un sensor de imagen CMOS con una resolución de hasta 3840 * 2160 con
ángulo de visión de 150 grados y luz adaptativa (Ro ca & Viviana, 2021); bocinas de escritorio; Leds;
Polietileno de Alta Densidad (HDPE) para hacer la base a modo de poder acomodar la hoja donde se
encuentre el texto y la cámara tenga el mejor ángulo, además de que sea estético, este material cuenta con
características útiles como buena resistencia química y a bajas temperaturas, además de ser de bajo coste
por lo que lo vuelve una buena opción (Jubedi, S.L., 2019); botones; eso
pág. 8591
en cuestión de la parte física, ahora del lado de la programación lo que se usó fue la tecnología conocido
como OCR tecnología usada plenamente para el uso de identificación de texto capaz de escanear
documentos y convertirlos en más que archivos de imágenes para la lectura de textos (Sing, Bacchuwar
& Bhasin, 2012), librerías especiales como tesseract ya que es una librería que podemos encontrar
en la tecnología de OCR y funge la función de reconocimiento de texto específicamente ( Kumar
Garai, Paul, Dey, Ghoshal, Biswas, & Mondal, 2022) para la salida de audio, conceptos de
OpenCV para el preprocesamiento de la imagen (Aurora, 2023).
El prototipo del primer código fue creado en la versión de Python 3.12 mediante el software
Visual Studio Code desarrollado por Microsoft para Windows, Linux, macOS y Web el cual es de
libre uso (Applications for Python). Este se trabajó en Windows 11 para ver el funcionamiento,
pero dado a las condiciones del entorno y del proyecto nos movimos a una placa de desarrollo de
buen rendimiento, bajos consumos energéticos y muy portable ideal para el proyecto el cual fue la
Orange Pi Zero 2W desarrollada por Shenzhen Xunlong Software Co., Ltd.
Esta placa utiliza un procesador Allwinner H616 de cuatro núcleos Cortex -A53 con una
frecuencia de hasta 1.5 GHz y gráficos Mali-G31 MP2, permitiéndole manejar tareas ligeras de
manera eficiente. La Orange Pi Zero 2W soporta varios sistemas operativos, incluidos Ubuntu,
Debian, y Android, lo que la convierte en una opción adaptable para diferentes aplicaciones la
cual se realizaron pruebas iniciales para verificar el cumplimiento de los requisitos básicos hechos
bajo el sistema operativo Debian (Orange Pi, 2024).
Posterior a la investigación hecha se comenzó con la realización del proyecto, haciendo como primera
instancia la parte del software, como base se utilizó la tecnología OCR-Python (Saravanan, et. Al, 2022),
más específicamente con la ayuda de la librería pytesseract (Kumar, Paul, Dey, Goshal, Biswas
& Mondal, 2022), la cual fue el principal para la identificación de los caracteres, cabe mencionar
que el uso de OpenCV también fue utilizado por la capacidad de éste de realizar procesamiento
de imágenes con gran facilidad. Los pasos seguidos dentro del código son:
Inicialización de la cámara, esto con el uso de OpenCV.
Adecuaciones al momento de iniciar la cámara de modo que los resultados de lectura fueran
más exactos.
pág. 8592
Procesamiento de imágenes donde se binariza la imagen utilizando diferentes métodos.
Extracción de texto, con valores específicos realiza la identificación de los caracteres con el
fin de extraer el texto de la imagen binarizada.
Cabe mencionar que esa captura queda guardada de forma local dentro de la Orange Pi hasta el momento
en el que se realiza la siguiente captura; y finalmente, el texto extraído, se convierte en audio el cual es
escuchado al final del proceso, esto con ayuda de diferentes librerías obtenidas de OpenCV.
Como segundo punto tenemos la parte física, se realizó el diseño de la base de HDPE obteniendo
una caja rectangular de 34 x 23 cm como base con una altura de 10 cm, dentro de la cual se
colocaron los demás componentes físicos: bocinas de escritorio, Orange Pi, el cableado
correspondiente de los botones y la batería usada como fuente de poder.
Figura 1. Acomodo de componentes internos acomodados dentro de la caja de HDPE
Colocando de forma externa la cámara a una altura de 35 cm, de modo que ésta enfoque la base
superior de la base de la caja y capture de manera óptima el texto. Uniendo tanto el software
como el hardware obtuvimos el producto final.
Figura 2. Producto final del proyecto. Vista lateral, anterior y posterior
Además se realizaron adecuaciones para su uso: se agregaron instrucciones habladas las cuales mencionan
los pasos que se deben seguir para el funcionamiento (el cómo colocar la hoja, qué botones deben
oprimirse y en qué orden) y se colocaron indicadores en escritura braille para los botones.
pág. 8593
Figura 3. Botones señalados en escritura Braille
Pruebas propuestas
Se realizaron 2 diferentes tipos de pruebas; La primera en cuestión a la funcionalidad del
proyecto, específicamente la efectividad de lectura de los textos por lo que se hicieron pruebas
con diferentes tipos y tamaños de letra fuente además de mano escritos, tomando en cuenta la
variable de la iluminación. La segunda prueba en relación a cómo es su uso en ambientes reales,
es decir, se buscaron a personas con deficiencias visuales, contando con 4 personas con ceguera y
6 personas de baja visión, todos ellos de diferentes edades y contextos distintos. Se les hizo una
exposición y se les pidió hicieran uso del dispositivo, para finalmente realizar el papeleo
necesario como lo fueron encuestas de satisfacción del proyecto.
RESULTADOS Y DISCUSIÓN
Las primeras pruebas que se realizaron fueron sobre el funcionamiento del equipo, con el fin de conocer
cuán preciso es el proyecto al momento de realizar la lectura dependiendo de la variable de iluminación. Se
consideraron las siguientes opciones de letras; Arial de tamaño 20, 18, 16, 14, 12, 8, 6 y 5, en este caso con
variables de luz controlada (siendo de día, sin iluminación extra estando dentro de un cuarto con las luces
apagadas), luz sobreexpuesta (de dia, dentro de un cuarto con luces prendidas además de tener encendido el
led con el que cuenta el aparato), luz natural (de día estando al aire libre) y con luz baja (atardeciendo
dentro de un cuarto con luces apagadas); Calibri de tamaño 20, 18, 16, 14, 12, 8, 6 y 5, pero solamente con
luz controlada; Times New Roman con tamaño de letra 20, 18, 16, 14, 12, 8, 6 y 5, de igual forma con luz
controlada; y finalmente con mano escritos de diferentes formas y luz controlada. Cabe mencionar que el
texto que se utilizó fue el prólogo del cuento “El Principito” de Antoine de Saint-Exupéry, el cual cuenta
con 95 palabras, esto sirve de pauta para saber la eficacia de lectura del proyecto.
pág. 8594
Tabla 2. Porcentajes promedio de las pruebas con letras fuente de computadora.
Luz Controlada
Luz Natural
Luz Baja
Luz Sobreexpuesta
Arial
Calibri
Times New
Arial
Arial
Arial
Roman
90%
91%
91%
88%
79%
11%
90%
89%
89%
89%
77%
9%
93%
91%
93%
85%
85%
0%
93%
93%
94%
86%
77%
0%
93%
92%
91%
90%
78%
0%
90%
91%
89%
88%
79%
0%
88%
88%
87%
88%
77%
0%
87%
88%
83%
89%
78%
0%
Tabla 3. Porcentajes promedio de las pruebas hechas con escritos a mano
Luz controlada
Luz Natural
Luz Baja
Luz Sobreexpuesta
Grande Clara
75%
60%
50%
5%
Grande no Clara
66%
56%
48%
2%
Mediana Clara
86%
70%
63%
3%
Mediana no Clara
62%
58%
45%
0%
Pequeña clara
64%
58%
43%
0%
pequeña no clara
54%
52%
38%
0%
Se colocaron los porcentajes promedio de las lecturas, para cada prueba se realizaron 5 mediciones de las
cuales se fueron tomando la cantidad de palabras leídas correctamente para después obtener los datos que
se muestran en la tabla, el tiempo de respuesta fue el mismo (45 segundos después de la captura de imagen)
en cada medición puesto que el texto fue el mismo y contábamos con una velocidad de internet de 100/15
Mbps. Se puede observar que independientemente del tipo de letra la mejor lectura se dio con la luz
controlada y siendo la peor lectura con luz baja.
Posteriormente se realizaron las pruebas con personas con DV, ya contábamos con los datos de la prueba
anterior por lo que estas se realizaron en un ambiente ideal para el equipo, se les dio una explicación del
funcionamiento del proyecto, netamente de cómo este realiza la lectura, cada uno realizó una inspección
táctil, y decidieron con que hacer las pruebas. Fueron un total de 15 preguntas de las cuales 9 de ellas eran
preguntas cerradas donde se calificaba al equipo del 1 al 5 (siendo 1 muy favorable y 5 nada favorable) en
diferentes aspectos como facilidad de uso, accesibilidad, entre otras.
pág. 8595
Gráfica 1. Representación de porcentajes en encuesta de satisfacción.
Se puede observar que el 72% de las respuestas fueron 1, el 26% fueron 2, el 2% corresponden a
la respuesta 3 y las respuestas 4 y 5 tienen un 0%.
Tabla 4. Percepción del proyecto reflejado en preguntas abiertas de la encuesta
Pregunta
Respuesta 1
Respuesta 2
Respuesta 3
Características
“Se podría agregar
“Adecuaciones para
“Las bocinas pueden ser
adicionales que le
bordes a la base para
más pequeñas para que la
hojas tamaño oficio”
gustaría implementar
colocar la hoja”
base sea menos tosca”
“Considero que es un
“Buen proyecto útil para
“El aparato es muy fácil
de usar y considero que
equipo que puede ser
ayudar en varios
Comentario sobre el
toma en cuenta
muy útil para personas
contextos, en nuestro
proyecto
necesidades básicas que
que no tienen acceso
caso ayudar en la oficina
personas visuales no
directo a la tecnología”
para agilizar tareas”
toman en cuenta”
Gracias a estos resultados vemos que el proyecto tuvo buen recibimiento.
CONCLUSIÓN
El proyecto cumple con el propósito principal de ofrecer una herramienta que ayude con la lectura
de textos que fue bien recibido por la comunidad de personas con DV, es un dispositivo de fácil
uso pues una vez que se realizaron las pruebas correspondientes logramos dar instrucciones más
concretas que facilitaron su uso en contextos reales. Observamos que a nivel de software aún
requiere de modificaciones ya que requiere el uso de internet, esto puede ralentizar el proceso sin
embargo se podrían utilizar librerías que no requieran internet para su funcionamiento. También
se pueden hacer modificaciones a la caja de modo que pueda leer hojas tamaño oficio, sería de
ayuda para contextos de oficinas.
pág. 8596
Fue una experiencia diferente compartir este proyecto con personas con DV, nos hicieron
comentarios muy constructivos sobre el proyecto y cada uno tenía ideas distintas, notamos que
cada una de ellas iban concuerdo a experiencias propias que personas visuales como nosotros ni
siquiera imaginamos. En conclusión, el prototipo es un primer paso prometedor, pero requiere
mejoras significativas para convertirse en una herramienta verdaderamente útil y accesible para
personas con discapacidad visual. Pero sobre todo es importante mencionar que el proyecto
cumple con el propósito de echarle un vistazo a una discapacidad, notarlos y aportar este granito
de arena para incluirlos de alguna forma en un mundo que no está preparado para verlos.
REFERENCIAS BIBLIOGRÁFICAS
Zhizhko, E. A. (2020). Inclusión de los niños con capacidades diferentes en escuelas regulares en
México: propósitos y realidad. Andamios, 17(43), 249-270.
“Sociedad Mexicana de Oftalmología - 10 de octubre Día Mundial de la Visión”. Sociedad
Mexicana de Oftalmología. Accedido el 24 de octubre de 2024. [En línea]. Disponible:
https://smo.org.mx/blog/d91a0be0-0098-4f24-8d99-6469974ddb1c
Zamora López, P., & Marín Perabá, C. (2021). Tiflotecnologías para el alumnado con
discapacidad visual. Academo (Asunción), 8(1), 109-118.
Rang, M., Bi, Z., Liu, C., Wang, Y., & Han, K. (2023). An Empirical Study of Scaling Law for OCR.
arXiv e-prints, arXiv-2401.
Kaur, R. (2018). Text recognition applications for mobile devices. Journal of Global Research in
Computer Science, 9(4), 16-20.
El Maghraby, A. M. (2019). Mobile Phone cards recharge using OCR (Applied on android platform).
Journal of the ACS, 10.
Orange pi - orangepi. (s. f.).
http://www.orangepi.org/html/hardWare/computerAndMicrocontrollers/details/Orange -Pi-
Zero-2W.html
Saravanan, K. ., Chew, C. C., Tay, K. G., Kek, S. L., & Huong, A. (2022). Exam Marks Summation App
Using Tesseract OCR in Python. International Journal of Integrated Engineering, 14(3), 102-110.
https://publisher.uthm.edu.my/ojs/index.php/ijie/article/view/10516
pág. 8597
Kumar Garai, S., Paul, O., Dey, U., Ghoshal, S., Biswas, N., & Mondal, S. (2022). A novel
method for image to text extraction using tesseract-OCR. American Journal of
Electronics & Communication, 3(2), 8-11.
HDPE polipropileno de alta densidad. (2019, mayo). Recuperado 30 de noviembre de 2024, de
https://juedi.com/wp-content/uploads/2019/09/HDPE-Polietileno-alta-densidad.pdf
Singh, A., Bacchuwar, K., & Bhasin, A. (2012). A survey of OCR applications. International
Journal of Machine Learning and Computing, 2(3), 314.
Kumar Garai, S., Paul, O., Dey, U., Ghoshal, S., Biswas, N., & Mondal, S. (2022). A novel
method for image to text extraction using tesseract-OCR. American Journal of
Electronics & Communication, 3(2), 8-11.
Roca, A., & Viviana, K. (2021). Sistema de detección de personas y cálculo de distancias
euclidianas mediante el uso de redes neuronales convolucionales integrando OpenCV y
CUDA para medir el índice de cumplimiento del distanciamiento social de los estudiantes
de la EEB Lcda. Angélica Villón Lindao (Bachelor's thesis, La Libertad: Universidad
Estatal Península de Santa Elena, 2021).
Aurora. (2023, 18 julio). ¿Qué son las librerías de Python? ID Digital School - Bootcamps.
https://iddigitalschool.com/bootcamps/que-son-las-librerias-de-
python/#:~:text=En%20el%20contexto%20de%20Python,sitios%20web%2C%20entre%20m
uchas%20otras
Applications for Python. (s/f). Python.org. Recuperado el 29 de noviembre de 2024, de
https://www.python.org/about/apps
Acevedo Cote, M. F., & Morales Romero, S. M. (2023). Implementación de OCR:
reconocimiento óptico de caracteres para búsqueda de coincidencias en compras en líneas.
ROMO MARIN, D. F. (2020). SOFTWARE DE RECONOCIMIENTO OPTICO DE CARACTERES.
Carranza, L. E. A., Olivera, M. V. M., García, O. S., & Herrera, V. G. H. (2017). RECONOCIMIENTO
DE CARACTERES ALFANUMÉRICOS HACIENDO USO DE MEMORIAS
ASOCIATIVAS ALFA-BETA. Pistas Educativas, 39(125).
pág. 8598
Durán Gómez, M. (2013). Reconocimiento de caracteres ópticos OCR por medio de correlación y
redes neuronales.
Lema Balladares, L. O. (2014). Sistema de reconocimiento de imagen para detección de placas
de vehículo obtenidas con cámara web, basado en lenguaje de programación matlab
(Bachelor's thesis, Quito: Universidad Israel, 2014).
pág. 8599