¿Cuál sería la mejor manera de comenzar en Lingüística Computacional si actualmente tengo 15 años?

Suponiendo que desea prepararse para una carrera profesional en lingüística computacional, la mejor manera de comenzar a su edad es sentar las bases estudiando algunos temas fundamentales. Debería estar estudiando al menos dos idiomas extranjeros, preferiblemente si uno es de una familia de idiomas diferente a su idioma nativo. Entonces, si su lengua materna es el inglés, podría estudiar español y mandarín, por ejemplo. Eso le daría una comprensión profunda de la complejidad del problema que abordará en Lingüística Computacional. También mejorará sus perspectivas laborales. Estudiar solo un idioma extranjero puede dar la impresión de que todos los idiomas extranjeros son iguales (“si el español tiene un género gramatical y conjugaciones verbales complejas, deben ser características de cada idioma extranjero”). Entonces estudia dos idiomas.
El segundo tema fundamental es la matemática, especialmente la probabilidad, las estadísticas y el cálculo. Cuantas más matemáticas, mejor, lo que te ayudará con fluidez y habilidad además del conocimiento.
Finalmente, desea estudiar la mayor cantidad de ciencias de la computación que pueda, pero no solo la codificación. Desea comprender los principios de los sistemas computacionales complejos porque los sistemas de lingüística computacional pueden ser muy complejos. Temas como búsqueda, lenguajes formales y complejidad computacional serán útiles. No sé si tienes la oportunidad de estudiar mucha informática a tu edad, pero haz lo que puedas.
¡Buena suerte! He estado haciendo lingüística computacional durante treinta años, y sigue siendo lo más divertido que puedo imaginar hacer.

Dudo que puedas hacer algo inmediatamente en CL. Aunque hay cursos en línea como https://www.coursera.org/course/nlp de Dan Jurafsky, que es una de las mejores personas en el campo, probablemente todavía no tenga los antecedentes para ello.

Entonces, qué puedes hacer ahora? Bueno, claramente es útil aprender Ciencias de la Computación y Lingüística. Para CS, lo primero es aprender a programar y tratar de tomar tantas clases introductorias de CS como sea posible, enfocándose en algoritmos y estructuras de datos. Y, por supuesto, simplemente construir cosas. Para la lingüística, es más difícil. Es poco probable que encuentre muchos cursos de nivel secundario. Aún así, puede intentar aprender un poco sobre gramática, semántica (o, al menos, lógica) y fonología por su cuenta. Quizás también aprenda sobre lingüística histórica (a menudo hay libros sobre historia del inglés, por ejemplo, y también puede haber fuentes en línea). Por supuesto, es útil aprender otro idioma, aunque muchos (quizás la mayoría) de los lingüistas en los Estados Unidos son de hecho monolingües.

Recomiendo leer “Fundamentos del procesamiento estadístico del lenguaje natural”, por Christopher Manning e Hinrich Schütze.
Cubre los conceptos básicos que necesitará para seguir avanzando.

Después de eso, recomendaría descargar la biblioteca de pitón NLTK y leer “Procesamiento de lenguaje natural con Python”, por Steven Bird, Ewan Klein y Edward Loper. Dejaré el google por ti.

Buena suerte y que la fuerza te acompañe en este viaje, joven padawan.

Comenzaría con un proyecto práctico, como un filtro de spam, un corrector ortográfico o un bot de chat, que resuelva un problema o al menos un objetivo que le interese.

Encontrará muchos problemas más pequeños mientras lo hace. Entonces la lectura sobre teoría y técnicas comunes tendrá más sentido.