¿Qué es Data Science?
La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva.
La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva.
Se encarga de extraer información de grandes cantidades de datos con el objetivo de tomar decisiones. El Data Science se encarga de estudiar de dónde viene la información, qué representa y cómo se puede convertir en un recurso valioso en la creación de negocios y estrategias. Para ello, busca extraer grandes cantidades de datos para identificar patrones para ayudar a una organización a controlar los costes, aumentar la eficiencia, reconocer nuevas oportunidades de mercado y aumentar la ventaja competitiva de la organización.
Historia del Data Science
En 1962, John W. Tukey precedió al término “Ciencia de Datos” en su artículo “The Future of Data Analysis” al explicar una evolución de la estadística matemática. En este, definió por primera vez el análisis de datos como: “Procedimientos para analizar datos, técnicas para interpretar los resultados de dichos procedimientos, formas de planificar la recopilación de datos para hacer su análisis más fácil, más preciso o acertado, y toda la maquinaria y los resultados de las estadísticas matemáticas que se aplican al análisis de datos.”
En 2001, William S. Cleveland introdujo a la ciencia de datos como una disciplina independiente, extendiendo el campo de la estadística para incluir los avances en computación con datos en su artículo “Data science: an action plan for expanding the technical areas of the field of statistics”. Cleveland estableció seis áreas técnicas que en su opinión conformarían al campo de la ciencia de datos: investigaciones multidisciplinarias, modelos y métodos para datos, computación con datos, pedagogía, evaluación de herramientas, y teoría.
¿Data Science es lo mismo que Big Data?
Big Data es una gran colección de conjuntos de datos que no se pueden almacenar en un sistema tradicional. Su tamaño puede variar hasta peta-bytes. Según la empresa Gartner: Big Data es información con gran volumen, velocidad rápida y mucha variedad que demanda una plataforma innovadora para mejorar los conocimientos para la toma de decisiones. El Big Data es una forma de resolver todos los problemas no resueltos relacionados con la gestión y el manejo de datos.
Data Science se centra herramientas y lenguajes que transforman los datos en información de valor. De esta se desprenden otras disciplinas que ayudan a que esta actividad sea más solida:
Principales Beneficios del Data Science
El principal beneficio del Data Science en una organización es la facilidad para tomar decisiones. Las organizaciones con Data Scientists pueden incluir evidencia cuantificable basada en datos en sus decisiones comerciales. Estas decisiones basadas en datos pueden, en última instancia, llevar a una mayor rentabilidad y una mejor eficiencia operativa, rendimiento comercial y flujos de trabajo. En las organizaciones orientadas al cliente, el Data Science ayuda a identificar y refinar las audiencias objetivo.
Perfil de un Data Scientist
El perfil de Data Scientist se esta convirtiendo en una de las profesiones con mayor demanda por las empresas. Los sueldos, como en general en el mundo del desarrollo de software, cambian mucho dependiendo de el lugar, las funciones y el empleador. Algunas posiciones que ofertan las empresas son las siguientes:
Data ScientistEspecializado en la extracción de conocimiento a través de los datos. Entre sus funciones está la construcción de algoritmos que faciliten la extracción y organización de la información. Habitualmente, el Data Scientist tiene conocimientos matemáticos, estadísticos y de programación.
Data EngineerHace que los datos sean accesibles para su manipulación por parte de los Data Scientist. Entre sus funciones están la utilización de herramientas y procesos para el desarrollo de aplicaciones de Big Data.
Data AnalystEs la persona encargada de interpretar los datos extraídos a través de diferentes técnicas. Analiza y presenta resultados que deben traducirse en conclusiones.
Chief Data Officer (CDO)Dentro de una compañía es el máximo responsable de la gestión de datos. Es la persona encargada de liderar al resto de perfiles descritos anteriormente.