Por qué usar software open source

Introducción: qué es open source

Según Wikipedia, el open source software (software de código abierto) es un tipo de software cuyo código es de público conocimiento, ya sea gratis o bajo alguna licencia de código abierto. Los usuarios del código pueden utilizar, cambiar y redistribuir el código, ya sea en su forma original o modificada. Generalmente, el software open source se produce de manera colaborativa, y los resultados se publican en internet.

Herramientas open source para data science y machine learning

Entre las herramientas más populares para el desarrollo de data science y machine learning se encuentra los lenguajes de programación Python y R Project. También destacan muchas herramientas desarrolladas para estos lenguajes (u otros), de gran popularidad, como por ejemplo: TensorFlow, Keras, Scikit-Learn, Theano, PyTorch, Pandas, Numpy, Hadoop, Spark, Matplotlib, Ggplot2, Dplyr, Caret, etc.

Fuente: https://medium.com/

El software open source es un incentivo a la innovación

El progreso científico se acelera y su costo se reduce cuando se usa software de código abierto, ya que un inmenso número de investigadores y equipos de trabajo colabora activamente en el desarrollo de nuevas tecnologías. Asimismo, se facilita trabajar sobre la base del conocimiento previo, ya que las tecnologías desarrolladas se ponen rápidamente a disposición de los usuarios, lo que no ocurre con el software comercial, que siempre se encontrará rezagado respecto del software libre, ya que depende de una sola compañía con equipos de desarrollo limitados.

Las tecnologías open source mejoran continuamente

Gracias a que una gran cantidad de personas trabaja con software libre, ya sea en su desarrollo o como usuario, se hace más fácil y rápido encontrar errores en el código, así como también oportunidades de mejora, lo que permite que las tecnologías desarrolladas con software open source experimenten una mejora continua. De hecho, muchas importantes compañías como Google, Facebook y Microsoft se encuentran desarrollando proyectos bajo la modalidad open source, con el objetivo de acelerar el desarrollo de las nuevas tecnologías.

El software libre democratiza el acceso a las nuevas tecnologías

El software libre ha permitido una rápida adopción de herramientas de data science y machine learning en muchas empresas e industrias, independientemente de su tamaño, ya que pone a disposición del público una gran variedad de tecnologías gratis y de gran calidad. Por lo tanto, democratiza el acceso a la tecnología, y permite a muchas empresas pequeñas competir en sus respectivos mercados. Así, el costo deja de ser una barrera para la adopción de nuevas tecnologías.

Las tecnologías de código libre mejoran el capital humano y potencian los mercados laborales

Para muchas empresas es difícil encontrar capital humano altamente calificado en el uso de tecnologías, sobre todo en el caso del software comercial pagado, que no está disponible para cualquiera debido a sus altos costos. En cambio, el software libre permite que cualquiera acceda y se capacite en diversas áreas de la ciencia a muy bajo costo o incluso gratis, ya que existen grandes comunidades de usuarios y desarrolladores que se apoyan mutuamente. Una ejemplo destacable es StackOverflow, donde los usuarios pueden encontrar respuestas a miles de preguntas comunes. De esta manera, también ganan las empresas, ya que habrá una mayor cantidad de potenciales empleados disponibles para las empresas que usen software de código abierto.

Deep learning: un ejemplo de tecnología open source

Para concluir se destaca el caso del Deep Learning redes neuronales profundas) cuyo desarrollo ha sido posible fundamentalmente gracias a las tecnologías open source. El software libre ofrece ventajas invaluables en este campo, tanto para para desarrolladores como para los usuarios. Por ejemplo, permite que investigadores y usuarios accedan a complejas arquitecturas de redes neuronales de vanguardia, presentadas en los más recientes artículos académicos, que usualmente son difíciles de replicar con sólo leer el artículo incluso para académicos de las más prestigiosas universidades, debido a la gran cantidad de particularidades de su diseño y entrenamiento. Afortunadamente, los autores de los artículos suelen poner sus modelos a disposición del público, en plataformas como GitHub, con licencias de código abierto. Asimismo, es posible acceder a modelos pre entrenados, lo que hace mucho más rápido y fácil el trabajo a los usuarios en comparación a desarrollar una arquitectura propia desde cero. Dichos modelos han sido entrenados con bases de datos muy grandes, y con una gran capacidad computacional, como es el uso de múltiples GPUs, que normalmente no está al alcance del público general.


Contenido relacionado