{"id":260,"date":"2019-08-13T13:12:37","date_gmt":"2019-08-13T13:12:37","guid":{"rendered":"http:\/\/www.languagetrainers.es\/blog\/?p=260"},"modified":"2019-08-13T13:12:37","modified_gmt":"2019-08-13T13:12:37","slug":"reconocimiento-automatico-nuestro-habla","status":"publish","type":"post","link":"https:\/\/www.languagetrainers.es\/blog\/reconocimiento-automatico-nuestro-habla\/","title":{"rendered":"Reconociendo el reconocimiento autom\u00e1tico de nuestro habla"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">El reconocimiento autom\u00e1tico del habla ha avanzado mucho desde sus comienzos en la d\u00e9cada de 1950. En esa \u00e9poca, se construy\u00f3 una m\u00e1quina que pod\u00eda reconocer los n\u00fameros del uno al nueve. Hoy en d\u00eda, podemos convertir nuestras voces en texto, hablar con contestadoras inteligentes, programar a Alexa, Siri o Cortana para que nos ayuden a usar menos nuestros cerebros. Pero la mayor\u00eda de estos cambios est\u00e1n centrados en el ingl\u00e9s. Entonces, \u00bfqu\u00e9 nos queda al resto del planeta?<\/span><\/p>\n<h2><span style=\"font-weight: 400;\">Reconocimiento autom\u00e1tico del habla<\/span><\/h2>\n<div id=\"attachment_261\" style=\"width: 260px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-261\" class=\"wp-image-261 size-medium\" src=\"http:\/\/www.languagetrainers.es\/blog\/wp-content\/uploads\/2019\/08\/8521574017_e656088012_z-250x250.jpg\" alt=\"\" width=\"250\" height=\"250\" srcset=\"https:\/\/www.languagetrainers.es\/blog\/wp-content\/uploads\/2019\/08\/8521574017_e656088012_z-250x250.jpg 250w, https:\/\/www.languagetrainers.es\/blog\/wp-content\/uploads\/2019\/08\/8521574017_e656088012_z-150x150.jpg 150w, https:\/\/www.languagetrainers.es\/blog\/wp-content\/uploads\/2019\/08\/8521574017_e656088012_z-120x120.jpg 120w, https:\/\/www.languagetrainers.es\/blog\/wp-content\/uploads\/2019\/08\/8521574017_e656088012_z.jpg 612w\" sizes=\"(max-width: 250px) 100vw, 250px\" \/><p id=\"caption-attachment-261\" class=\"wp-caption-text\">Imagen v\u00eda <a href=\"https:\/\/www.flickr.com\/photos\/81824524@N02\/8521574017\/\">Flickr<\/a>.<\/p><\/div>\n<p><span style=\"font-weight: 400;\">Bueno, no, no <\/span><i><span style=\"font-weight: 400;\">todo<\/span><\/i><span style=\"font-weight: 400;\"> el reconocimiento autom\u00e1tico del habla (RAH) o de la voz es en ingl\u00e9s. El programa \u201cVoz a texto\u201d de Google Cloud le permite a los programadores convertir audio a texto en 120 idiomas. Y muchas otras <\/span><i><span style=\"font-weight: 400;\">start-ups<\/span><\/i><span style=\"font-weight: 400;\"> dedicadas al RAH multiling\u00fce a medida aparecen constantemente. Todas apuntan a distintos segmentos del mercado, desde telecomunicaciones a transcripciones, pasando por cualquier cosa imaginable.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Pero algo <\/span><i><span style=\"font-weight: 400;\">multiling\u00fce<\/span><\/i><span style=\"font-weight: 400;\"> no est\u00e1 sucediendo al mismo tiempo con el reconocimiento de voz. No es tan f\u00e1cil hablar con un dispositivo en ruso, por ejemplo, y que lo convierta todo a un texto en espa\u00f1ol. Suceden dos casos: o hablamos en nuestra lengua nativa que es traducida a texto o es una traducci\u00f3n m\u00e1s o menos correcta entre un idioma y el otro. Ambas cosas juntas, por ahora, no suceden. El reconocimiento autom\u00e1tico del habla del futuro tendr\u00e1 que ser realmente efectivo si quiere ofrecernos lo que queramos en cualquier idioma.\u00a0<\/span><\/p>\n<h3>\u00bfNo puedes esperar a que la tecnolog\u00eda te ayude con los idiomas? \u00a1<a href=\"http:\/\/www.languagetrainers.es\/contacto.php\">Cont\u00e1ctanos<\/a> que nosotros te ayudamos!<\/h3>\n<h2>\u00bfQu\u00e9 es el reconocimiento del habla?<\/h2>\n<p><span style=\"font-weight: 400;\">\u201cReconocimiento de voz\u201d es un t\u00e9rmino gen\u00e9rico que nos facilita la vida al hacer que la tecnolog\u00eda que nos rodea haga lo que nosotros queremos al <\/span><i><span style=\"font-weight: 400;\">tan solo <\/span><\/i><span style=\"font-weight: 400;\">pedirlo. Podemos por ejemplo hablar con nuestras tabletas para que escriban nuestros pensamientos. O podemos hacer que ciertos sitios de internet nos lean lo que pone la p\u00e1gina.\u00a0<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Nuestros asistentes virtuales como Siri han simplificado el hacer un lista del mercado o el elegir una lista de reproducci\u00f3n acorde a cada situaci\u00f3n. El reconocimiento de voz en los coches ha ayudado a hacer llamadas realmente con las manos libres. Y podemos controlar el aire acondicionado o calefacci\u00f3n de nuestras casas sin siquiera oprimir un bot\u00f3n. Hay tantas cosas que el reconocimiento de voz puede hacer por nosotros que nos estamos haciendo dependientes (\u00a1o desesperados por m\u00e1s!).<\/span><\/p>\n<h2><span style=\"font-weight: 400;\">Conversaciones basadas en reconocimiento<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">Si un futuro en base al reconocimiento del habla es al que apuntamos, pensemos en las posibilidades para el lenguaje y la traducci\u00f3n. Podemos conectarnos con una clientela mundial sin siquiera tener que traducir nada. Podemos ir a cualquier restaurante en cualquier pa\u00eds y ordenar exactamente lo que queremos sin inconvenientes. Pedir asistencia m\u00e9dica durante un viaje no ser\u00e1 una preocupaci\u00f3n. Y, si bien pasar por controles de frontera y de migraci\u00f3n no ser\u00e1n m\u00e1s divertidos, al menos podremos sacarle una sonrisa al personal que quien hablemos \u2014siempre y cuando siga siendo una persona y no una m\u00e1quina.<\/span><\/p>\n<p>&lt;iframe src=\u00bbhttps:\/\/giphy.com\/embed\/oNhAOVr7eLynu\u00bb width=\u00bb480&#8243; height=\u00bb270&#8243; frameBorder=\u00bb0&#8243; class=\u00bbgiphy-embed\u00bb allowFullScreen&gt;&lt;\/iframe&gt;&lt;p&gt;&lt;a href=\u00bbhttps:\/\/giphy.com\/gifs\/oNhAOVr7eLynu\u00bb&gt;via GIPHY&lt;\/a&gt;&lt;\/p&gt;<\/p>\n<h2><span style=\"font-weight: 400;\">El problema<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">Hablar en un idioma y verlo salir como otro suena realmente como algo salido de Doctor Who o Futurama. Eso s\u00ed, nuestra tecnolog\u00eda no suena tan divertida como una TARDIS o una creaci\u00f3n del Profesor Farnsworth. Las interfaces de programaci\u00f3n de aplicaciones (APIs por su sigla en ingl\u00e9s) por ejemplo son esencialmente un conjunto de reglas que determina c\u00f3mo interact\u00faan los diferentes componentes de un software. Para que nuestras interfaces puedan reconocer todos los idiomas, primero deben aprenderlos. Y esto no quiere decir que un mont\u00f3n de robots e interfaces tienen que ir a la escuela.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">El aprendizaje autom\u00e1tico detr\u00e1s de estas interfaces necesita ser capaz de reconocer m\u00e1s que solo el vocabulario que compone un idioma individual. Debe tambi\u00e9n aprender toda la sem\u00e1ntica del lenguaje, cada aspecto de la gram\u00e1tica y hasta cada fonema individual dentro del alfabeto.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">Como si fuera poco, un RAH efectivo necesitar\u00eda reconocer cosas como expresiones dial\u00e9cticas y coloquiales que hasta complican a los aprendices de carne y hueso. Sin embargo, mientras un humano puede identificar aspectos idiom\u00e1ticos como palabras prestadas y cognados, una <\/span><i><span style=\"font-weight: 400;\">m\u00e1quina<\/span><\/i><span style=\"font-weight: 400;\"> posiblemente la tenga dif\u00edcil.<\/span><\/p>\n<div id=\"attachment_262\" style=\"width: 650px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-262\" class=\"wp-image-262 size-full\" src=\"http:\/\/www.languagetrainers.es\/blog\/wp-content\/uploads\/2019\/08\/welcome-905562_640.png\" alt=\"\" width=\"640\" height=\"426\" srcset=\"https:\/\/www.languagetrainers.es\/blog\/wp-content\/uploads\/2019\/08\/welcome-905562_640.png 640w, https:\/\/www.languagetrainers.es\/blog\/wp-content\/uploads\/2019\/08\/welcome-905562_640-250x166.png 250w, https:\/\/www.languagetrainers.es\/blog\/wp-content\/uploads\/2019\/08\/welcome-905562_640-120x80.png 120w\" sizes=\"(max-width: 640px) 100vw, 640px\" \/><p id=\"caption-attachment-262\" class=\"wp-caption-text\">Imagen v\u00eda <a href=\"https:\/\/pixabay.com\/illustrations\/welcome-words-greeting-language-905562\/\">Pixabay<\/a>.<\/p><\/div>\n<h2><span style=\"font-weight: 400;\">Diversidad<\/span><\/h2>\n<p><span style=\"font-weight: 400;\">Encontrar una soluci\u00f3n estandarizada a la conversi\u00f3n de cada idioma de nuestro planeta sin tener que aprenderlos nosotros mismos no va a suceder de la noche a la ma\u00f1ana. Empresas dentro del mercado del reconocimiento de voz est\u00e1n creando y concentr\u00e1ndose en diversos nichos. Sin embargo, eso no significa que se enfoquen en una amplia variedad de idiomas. Dicho eso, cada paso en la creaci\u00f3n de algoritmos ling\u00fc\u00edsticos ser\u00e1 de gran ayuda para la educaci\u00f3n.<\/span><\/p>\n<p><span style=\"font-weight: 400;\">El software de reconocimiento de idioma ideal no solamente ser\u00e1 capaz de distinguir entre idiomas individuales y traducirlos en cada m\u00ednimo aspecto, sino que tambi\u00e9n podr\u00e1 entender y replicar diferentes dialectos de cada uno de esos idiomas. Lo que sea que suceda, \u00a1de seguro va a ser como salido de una pel\u00edcula de ciencia ficci\u00f3n!<\/span><\/p>\n","protected":false},"excerpt":{"rendered":"El reconocimiento autom\u00e1tico del habla ha avanzado mucho desde sus comienzos en la d\u00e9cada de 1950. En&#8230;","protected":false},"author":2,"featured_media":262,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[10,50,55,9],"tags":[91,15,90,92],"class_list":["post-260","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-cultura","category-curiosidades","category-tecnologia","category-vida-digital","tag-automatizacion","tag-idiomas","tag-tecnologia","tag-traduccion"],"_links":{"self":[{"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/posts\/260"}],"collection":[{"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/comments?post=260"}],"version-history":[{"count":1,"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/posts\/260\/revisions"}],"predecessor-version":[{"id":263,"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/posts\/260\/revisions\/263"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/media\/262"}],"wp:attachment":[{"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/media?parent=260"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/categories?post=260"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.languagetrainers.es\/blog\/wp-json\/wp\/v2\/tags?post=260"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}