Quiero escribir mi propio código para bosques aleatorios. Probar diferentes formas de dividir cada nodo. ¿Qué lenguaje de programación sería el mejor?

Esto suena como si estuvieras investigando nuevos métodos y también estás entendiendo bosques aleatorios.

Mi sugerencia es, por lo tanto, elegir algo con lo que se sienta cómodo siempre que pueda ser bastante rápido. Si necesita aprender mucho sobre el idioma en el que está codificando, no aprenderá tanto sobre bosques aleatorios.

R estaría bien. También lo haría Java o C ++. Los dos últimos serían mejores en términos de velocidad si estuvieras tan cómodo en ellos como R. Otro que quizás quieras considerar es Python, incluso si no lo sabes en absoluto.

Parece que estoy diciendo algo diferente de lo que dije en el segundo párrafo, y supongo que sí, pero escúchame. Python es un lenguaje en sí mismo, a diferencia de R, que es un entorno equipado con un lenguaje. La codificación de un bosque aleatorio en R puro será desagradable, ya que R estándar de CRAN es un cerdo de memoria. Python tiene similitudes sintácticas con R. Y Python tiene, por ejemplo, Numba, que puede acelerar su código considerablemente una vez que haya hecho una prueba de concepto.

Python también tomará menos tiempo de desarrollo que todo menos R … y posiblemente menos que R.

Solo poniéndolo ahí afuera.

Puedo hacerlo en R. Para crear prototipos de su solución, es probablemente una de las mejores opciones. Puede usar paquetes existentes para hacer que su código sea más eficiente como dplyr, por ejemplo.

Si encuentra algo y quiere escribir su propia implementación, entonces debe considerar la comunidad, por ejemplo, ¿preferiría tenerla para R o Python o Scala? ¿O lo portarías en varios idiomas?

Lo importante en este punto es que su código debe ser lo más defensivo posible y lo más eficaz posible.

Gracias por A2A,

No creo que el lenguaje de programación sea algo en lo que debas centrarte. Pero más bien codifíquelo en el que mejor conoce. Puede programarlo en cualquier idioma, ya sea R, Python, Java, Scala o incluso Javascript.

Sí, puedes probar diferentes métodos de división en R y es bastante fácil hacerlo con R.

Puede escribir un código R para randomForest de manera que suceda paralelamente (ejecución paralela de diferentes fragmentos de código) si la configuración de su sistema no es muy alta.

No implica muchas líneas de código para ello.

¡¡Espero eso ayude!!