Si se descubrieran textos de dos idiomas desconocidos que usaran el mismo sistema de escritura, ¿podrían los lingüistas distinguirlos?

Todo depende de la cantidad de texto disponible (también conocido como corpus).

  • Lo primero que se haría es un análisis de frecuencia de letras de los textos. Eso solo suele ser suficiente para distinguir dos idiomas … suponiendo, por supuesto, que existen diferencias reales.
  • Basado en lo anterior, surgiría rápidamente si el sistema de escritura es alfabético (latín, griego, …), silábico (kana japonés, etc.) o logográfico (chino, kanji japonés, etc.), o algo más.
  • El siguiente sería el análisis de frecuencia de palabras. Incluso se podría tratar de descifrar los idiomas. Comience mirando las palabras más frecuentes y adivine el significado. Inicialmente esto es pura conjetura, pero hay una buena posibilidad de que después de un tiempo emerja algo utilizable.
  • Si los idiomas se vuelven inflexibles (como, por ejemplo, latín, ruso y húngaro, etc.), se puede obtener información adicional. El húngaro, por ejemplo, utiliza afijos adjuntos a las palabras para alterar su significado … el afijo para un significado particular es el mismo (con variación para acomodar la pronunciación fácil. Por lo tanto, los afijos pueden reconocerse para llegar a las palabras raíz.

Muy probablemente, sí, suponiendo que haya una cantidad razonable de texto disponible para ambos idiomas. Una forma sería mirando la frecuencia de los personajes. La frecuencia de sonidos particulares es diferente en diferentes idiomas. Si el sistema de escritura es un sistema fonológico, es decir, uno en el que los caracteres representan los sonidos de los enunciados, los caracteres tendrán frecuencias diferentes porque los sonidos tienen frecuencias diferentes. Una técnica similar pero más compleja sería observar la frecuencia con que un personaje sigue a otro. Es probable que diferentes idiomas que usan el mismo sistema de escritura tengan diferentes fonotácticas, es decir, diferentes reglas que gobiernan qué sonidos ocurren en qué posiciones.

Si. Dado un tamaño de muestra lo suficientemente grande, con bastante facilidad. Tomemos inglés y francés. Estos dos idiomas usan el mismo sistema de escritura (aunque con pequeñas diferencias): letras latinas. Sería evidente que las palabras están estructuradas de manera diferente, así como las oraciones. Esas diferencias en la escritura (como el uso de la circunfleja y las marcas de acento) también darían pistas a los futuros lingüistas sobre las diferencias. Por lo tanto, esos futuros lingüistas no tendrían problemas para reconocer que estos son dos idiomas diferentes, aunque es posible que no entiendan el contenido de esos idiomas como se representa en su escritura.

Pueden, pero se encontrarán en un pequeño problema al encontrar el siguiente ejemplo,

Man Yoshu es una recopilación de poemas en el antiguo Japón. Todo estaba escrito en caracteres chinos, pero muchas palabras solo representan pronunciaciones en japonés antiguo pero no significados en chino. Para los chinos, podemos pronunciar todas las palabras, pero solo entendemos una parte porque no sabemos qué significarán algunas palabras en japonés.

Imagine que los caracteres chinos se perdieron en la historia, y los lingüistas excavaron un libro en chino y una copia de Man Yoshu , podrían tener problemas para diferenciar las palabras en los dos libros y podrían concluir que es debido a la diferencia dialéctica.