¿Qué es Data Science?

 

La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva.

La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva.

Se encarga de extraer información de grandes cantidades de datos con el objetivo de tomar decisiones. El Data Science se encarga de estudiar de dónde viene la información, qué representa y cómo se puede convertir en un recurso valioso en la creación de negocios y estrategias. Para ello, busca extraer grandes cantidades de datos para identificar patrones para ayudar a una organización a controlar los costes, aumentar la eficiencia, reconocer nuevas oportunidades de mercado y aumentar la ventaja competitiva de la organización.

Historia del Data Science

En 1962, John W. Tukey precedió al término “Ciencia de Datos” en su artículo “The Future of Data Analysis” al explicar una evolución de la estadística matemática. En este, definió por primera vez el análisis de datos como: “Procedimientos para analizar datos, técnicas para interpretar los resultados de dichos procedimientos, formas de planificar la recopilación de datos para hacer su análisis más fácil, más preciso o acertado, y toda la maquinaria y los resultados de las estadísticas matemáticas que se aplican al análisis de datos.”

En 2001, William S. Cleveland introdujo a la ciencia de datos como una disciplina independiente, extendiendo el campo de la estadística para incluir los avances en computación con datos en su artículo “Data science: an action plan for expanding the technical areas of the field of statistics”. Cleveland estableció seis áreas técnicas que en su opinión conformarían al campo de la ciencia de datos: investigaciones multidisciplinarias, modelos y métodos para datos, computación con datos, pedagogía, evaluación de herramientas, y teoría.

¿Data Science es lo mismo que Big Data?

Big Data es una gran colección de conjuntos de datos que no se pueden almacenar en un sistema tradicional.  Su tamaño puede variar hasta peta-bytes. Según la empresa Gartner: Big Data es información con gran volumen, velocidad rápida y mucha  variedad que demanda una plataforma innovadora para mejorar los conocimientos para la toma de decisiones. El Big Data es una forma de resolver todos los problemas no resueltos relacionados con la gestión y el manejo de datos.

Data Science se centra herramientas y lenguajes que transforman los datos en información de valor. De esta se desprenden otras disciplinas que ayudan a que esta actividad sea más solida:

  • Data Mining
  • Deep Learning
  • Machine Learning
  • Inteligencia Artificial (IA
  • R
  • Python
  • SQL
  • Java
  • Scala
  • Julia
  • MatLab
  • Cython
  • Principales Beneficios del Data Science



    El principal beneficio del Data Science en una organización es la facilidad para tomar decisiones. Las organizaciones con Data Scientists pueden incluir evidencia cuantificable basada en datos en sus decisiones comerciales. Estas decisiones basadas en datos pueden, en última instancia, llevar a una mayor rentabilidad y una mejor eficiencia operativa, rendimiento comercial y flujos de trabajo. En las organizaciones orientadas al cliente, el Data Science ayuda a identificar y refinar las audiencias objetivo.

    Perfil de un Data Scientist

    El perfil de Data Scientist se esta convirtiendo en una de las profesiones con mayor demanda por las empresas. Los sueldos, como en general en el mundo del desarrollo de software, cambian mucho dependiendo de el lugar, las funciones y el empleador. Algunas posiciones que ofertan las empresas son las siguientes:

    Data Scientist

    Especializado en la extracción de conocimiento a través de los datos. Entre sus funciones está la construcción de algoritmos que faciliten la extracción y organización de la información. Habitualmente, el Data Scientist tiene conocimientos matemáticos, estadísticos y de programación.

    Data Engineer

    Hace que los datos sean accesibles para su manipulación por parte de los Data Scientist. Entre sus funciones están la utilización de herramientas y procesos para el desarrollo de aplicaciones de Big Data.

    Data Analyst

    Es la persona encargada de interpretar los datos extraídos a través de diferentes técnicas. Analiza y presenta resultados que deben traducirse en conclusiones.

    Chief Data Officer (CDO)

    Dentro de una compañía es el máximo responsable de la gestión de datos. Es la persona encargada de liderar al resto de perfiles descritos anteriormente.