Ciencia de datos

La existencia del Cometa Neowise (aquí representado como una serie de puntos rojos) fue descubierta mediante el análisis de datos (provenientes de un reconocimiento astronómico) adquiridos por un telescopio espacial, el Wide-field Infrared Survey Explorer.

La ciencia de datos es un campo académico interdisciplinario que utiliza estadística, computación científica, métodos, procesos, algoritmos y sistemas científicos para obtener (recolectar o extraer), tratar, analizar y presentar informes a partir de datos ruidosos, estructurados y no estructurados.[1]​ La ciencia de datos es multifacética y puede describirse como una ciencia, un paradigma de investigación, un método de investigación, una disciplina, un flujo de trabajo o una profesión.[2]

La ciencia de datos integra el conocimiento del dominio de la aplicación subyacente (por ejemplo, economía aplicada, investigación de mercados, finanzas, investigación de operaciones, medicina, tecnologías de la información, ciencias naturales)[3]​ con la estadística, el análisis de datos, la informática y sus métodos relacionados para comprender y analizar fenómenos "reales" con datos.[4]​ Utiliza técnicas y teorías extraídas de muchos campos dentro del contexto de las matemáticas, las estadísticas, las ciencias de la computación, las ciencias de la información y el conocimiento del dominio.[5]​ Sin embargo, la ciencia de datos es diferente de la informática, la estadística y la ciencia de la información. El ganador del premio Turing, Jim Gray, imaginó la ciencia de datos como un "cuarto paradigma" de la ciencia (empírico, teórico, computacional y ahora basado en datos) y afirmó que "todo sobre la ciencia está cambiando debido al impacto de la tecnología de la información" y la avalancha de datos.[6][7]

Un científico de datos es el profesional que mediante la escritura y aplicación de código de programación y conocimientos en estadística trabaja en la recolección de datos, la limpieza de datos, la exploración de datos, la modelación de datos, visualización de datos, la implementación de soluciones de aprendizaje automático y en la interpretación de resultados.[8]​ Los científicos de datos provienen de diferentes profesiones o backgrounds: matemáticos, ingenieros, economistas, actuarios, físicos, químicos, y en algunas ocasiones de campos que pudieran parecer muy distantes como la medicina.

  1. Liu, Alex (17 de septiembre de 2015). «Data Science and Data Scientist» (en inglés). Consultado el 24 de septiembre de 2015. 
  2. Mike, Koby and Hazzan, Orit. «Why Is It Hard to Define Data Science?». cacm.acm.org (en inglés). Consultado el 3 de enero de 2023. 
  3. Danyluk, A.; Leidig, P. (2021), «Computing Competencies for Undergraduate Data Science Curricula», ACM Data Science Task Force Final Report .
  4. Hayashi, Chikio (1 de enero de 1998). «What is Data Science? Fundamental Concepts and a Heuristic Example». En Hayashi, Chikio; Yajima, Keiji; Bock, Hans-Hermann; Ohsumi, Noboru; Tanaka, Yutaka; Baba, Yasumasa, eds. Data Science, Classification, and Related Methods. Studies in Classification, Data Analysis, and Knowledge Organization (en inglés). Springer Japan. pp. 40-51. ISBN 9784431702085. doi:10.1007/978-4-431-65950-1_3. 
  5. Cao, Longbing (29 de junio de 2017). «Data Science: A Comprehensive Overview». ACM Computing Surveys 50 (3): 43:1-43:42. ISSN 0360-0300. S2CID 207595944. doi:10.1145/3076253. 
  6. Tony Hey; Stewart Tansley; Kristin Michele Tolle (2009). The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research. ISBN 978-0-9825442-0-4. Archivado desde el original el 20 de marzo de 2017. 
  7. Bell, G.; Hey, T.; Szalay, A. (2009). «Computer Science: Beyond the Data Deluge». Science 323 (5919): 1297-1298. ISSN 0036-8075. PMID 19265007. S2CID 9743327. doi:10.1126/science.1170411. 
  8. Davenport, Thomas H.; Patil, D. J. (October 2012). «Data Scientist: The Sexiest Job of the 21st Century». Harvard Business Review 90 (10): 70-76, 128. PMID 23074866. Consultado el 18 de enero de 2016. 

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search