El ChatGPT no está cumpliendo las expectativas de los japoneses. El sistema no ha podido adaptarse a los caracteres, la precisión y los kanjis existentes en este idioma.
Las habilidades del ChatGPT ha deslumbrado a muchos, pero parece que a los japoneses no tanto. El chatbot ha presentado grandes dificultades para adaptarse al idioma y a la cultura japonesa, por esta razón, el gobierno, empresas privadas y Fugaku, la computadora más rápida del mundo, ha emprendido una carrera para generar un sistema de inteligencia que ofrezca mejores resultados o lo que podría ser un ChatGPT japonés.
La complejidad del idioma japonés y las sutilezas culturales han presentado desafíos en la implementación efectiva de estos sistemas de inteligencia artificial, conocidos como modelos de lenguaje grande (LLM).
Te sugerimos: ¿Por qué se puede vivir en Hiroshima y Nagasaki pero no en Chernóbil?
Fugaku, la gran computadora que construirá un ChatGPT japonés
En respuesta a estos desafíos, se están realizando desarrollos específicos para adaptar las tecnologías de inteligencia artificial al idioma y las necesidades locales. Esto incluye la investigación y el desarrollo de modelos de lenguaje específicos para el japonés.
Según un artículo publicado en Nature, la supercomputadora japonesa Fugaku fue una de las elegidas para la tarea de crear el procesador más poderoso del idioma, con el objetivo de desarrollar un ChatGPT japonés. El proyecto tiene el respaldo del Instituto de Tecnología de Tokio, Fujitsu y el grupo de centros de investigación RIKEN. Se espera que el resultado sea de código abierto y esté disponible el próximo año.
En Japón, existe la preocupación de que un LLM como el Chat GPT, de Open AI, no puedan captar las complejidades y las sutilezas del idioma. Expertos han señalado que la estructura de las oraciones en japonés es completamente diferente a la del inglés.
Solo para tener un contexto, el inglés tiene sólo 26 letras, este es el idioma que dominan las tecnologías ya existentes. En contraste, el japonés escrito consta de dos conjuntos de 48 caracteres básicos, más 2.136 caracteres chinos o kanji de uso habitual. La mayoría de estos últimos dos o más pronunciaciones, y existen aproximadamente 50.000 kanjis más que se utilizan raramente.
Con este nivel de complejidad, no sorprende que ChatGPT pueda tener problemas con el lenguaje a la hora de traducir las respuestas generadas de sus referencias en inglés. Keisuke Sakaguchi, investigador de la Universidad de Tohoku, explicó que el chatbot de Open AI algunas veces genera caracteres extremadamente raros y el resultado son palabras extrañas que la gente nunca ha visto.
«Los LLM públicos actuales, como GPT, sobresalen en inglés, pero a menudo se quedan cortos en japonés debido a diferencias en el sistema alfabético, datos limitados y otros factores», señaló.
También puedes leer: Catedral subterránea de Tokio: La estructura que salva a la ciudad japonesa de las inundaciones
Un ChatGPT para la ciencia
En la carrera por darle al país un ChatGPT en japonés ha sumado a varios grupos. Entre los competidores están el gigante tecnológico de supercomputadoras NEC, también SoftBank, Fugaku y el propio GPT, pero en su cuarta generación.
Por si fuera poco, Japón también está explorando el potencial de la inteligencia generativa en campos científicos. El Ministerio de Educación, Cultura, Deportes, Ciencia y Tecnología está financiando un LLM adaptado a las necesidades de los investigadores, capaz de generar hipótesis científicas a partir de hallazgos ya publicados.
Sigue leyendo:
«La ingeniería de los dioses»: así comenzó la tradición del origami en Japón, hace más de 500 años
NASA descubre 301 nuevos exoplanetas con un sistema de inteligencia artificial
Japón empieza el vertimiento de agua en Fukushima entre una fuerte controversia mundial