Lista de los 10 mejores libros y descripciones de ciencias de datos para el generalista

Lista de los 10 mejores libros y descripciones de ciencias de datos para el generalista

La ciencia de datos es el campo de estudio que maneja grandes cantidades de datos utilizando métodos científicos, procesos, algoritmos y sistemas para encontrar los patrones invisibles, obtener información significativa, tomar decisiones comerciales en las empresas y también usar en instituciones no comerciales. Las instituciones no comerciales incluyen industrias para la atención médica, juegos, reconocimiento de imágenes, sistemas de recomendación, logística, detección de fraude (instituciones bancarias y financieras), búsqueda en Internet, reconocimiento de voz, publicidad específica, planificación de rutas de aerolíneas y realidad aumentada. Data Science es un subconjunto de inteligencia artificial. Los datos que se utilizan para el análisis pueden provenir de muchas fuentes diferentes y se presentan en varios formatos. Algunos de los datos de origen pueden estar estandarizados; otros pueden no estar estandarizados.

Para decirlo de otra manera, se utilizan diferentes metodologías para recopilar los datos (plural del dato). Luego, el conocimiento (conclusiones valiosas) se extrae de los datos ensamblados. En el proceso, después de que se recopilan los datos, la investigación se realiza sobre ellos (datos) para obtener nuevos datos (resultados) de los cuales se resuelven los problemas.

La ciencia de datos como disciplina (mayor) existe en el nivel de licenciatura y maestría en la universidad. Sin embargo, solo unas pocas universidades del mundo ofrecen la ciencia de los datos en la licenciatura o maestría. En el nivel de licenciatura, los estudiantes se gradúan con un título en ciencias de los datos. Esto es como un título de propósito general. En el nivel de maestría, el estudiante se va con un título de posgrado en ciencias de datos, especializada en análisis de datos, ingeniería de datos o como científico de datos.

Puede sorprender al lector y posiblemente desafortunadamente, que el aprendizaje automático, el modelado, las estadísticas, la programación y las bases de datos son un conocimiento previo para estudiar las ciencias de los datos a nivel de licenciatura a pesar de que son cursos universitarios respetados en sus propios derechos, estudiados en Otras disciplinas a nivel de licenciatura o nivel de maestría. No obstante, cuando un estudiante va a una universidad para estudiar ciencias de datos a nivel de grado, todos estos cursos aún se estudiarán, junto con los cursos adecuados, para la ciencia de datos.

La ciencia de datos para licenciatura o sus especializaciones, como análisis de datos, ingeniería de datos o como científico de datos, aún se están desarrollando; Aunque llegaron a una etapa en la que se aplican en las industrias después de haber sido estudiados (en la universidad). La ciencia de datos es una disciplina relativamente muy nueva, en general.

Recuerde que primero debe ser generalista antes de convertirse en especialista. Las distinciones entre los programas de especialistas aún no están claras. Las distinciones entre los programas generalistas y especialistas aún no están claras.

Dado que la ciencia de datos es una disciplina relativamente nueva, los libros prescritos en este documento se basan en la cobertura de contenido y no en la pedagogía (qué tan bien enseña el libro). Y son para el programa de licenciatura (generalista). Hay diferentes cursos generalistas.

La lista

Para obtener más detalles y una posible compra con tarjeta de crédito, se proporciona un hipervínculo para cada uno de los libros. Ninguno de los libros cubre todos los cursos generalistas.

Matemáticas esenciales para ciencias de datos: cálculo, estadística, teoría de probabilidad y álgebra lineal

Escrito por: Hadrien Jean

  • Editorial: Hadrien Jean
  • Fecha publicada: después del 30 de septiembre de 2020
  • Idioma: inglés
  • No. de páginas: más de 400

El contenido de este libro puede verse como el curso de matemáticas para la ciencia de datos. Aunque no se recomienda aprender ciencia de datos por sí mismo, un graduado de secundaria que quiere aprender ciencias de datos por sí mismo debe comenzar con este libro.

Contenido: cálculo; Estadísticas y probabilidad; Álgebra lineal; Escalares y vectores; Matrices y tensores; Tramo, dependencia lineal y transformación del espacio; Sistemas de ecuaciones lineales; Vectores propios y valores propios; Valor singular de descomposición.

https: // www.EssentialMathfordataScience.com/

Una guía de sentido común para las estructuras y algoritmos de datos: nivele sus habilidades de programación central / 2da edición

Escrito por: Jay Wengrow

  • Editor: estantería pragmática
  • Fecha publicada: 15 de septiembre de 2020
  • Idioma: inglés
  • Dimensiones: 7.5 x 1.25 x 9.25 pulgadas
  • No. de páginas: 508

Este libro trata de algoritmos y estructuras de datos que se utilizan en la ciencia de datos. Suponiendo que alguien está aprendiendo ciencia de datos solo después de graduarse de la escuela secundaria, este es el próximo libro que lee después de leer el libro de matemáticas anteriores. Los programas de ejemplo se dan en JavaScript, Python y Ruby.

Contenido: por qué las estructuras de datos importan; Por qué importan los algoritmos; Oh si! Big O notación; Acelerando su código con Big O; Optimización del código con y sin Big O; Optimización para escenarios optimistas; Big O en el código cotidiano; Bolsa de búsqueda rápida con mesas hash; Elaboración de código elegante con pilas y colas; Recurrir recursivamente con recursión; Aprender a escribir en recursivo; Programación dinámica; Algoritmos recursivos para la velocidad; Estructuras de datos basadas en nodos; Acelerando todas las cosas con árboles de búsqueda binarios; Manteniendo sus prioridades rectas con montones; No le hace daño a Trie; Conectando todo con gráficos; Lidiar con limitaciones de espacio; Técnicas para la optimización de código

Ciencia de datos más inteligente: éxito con datos de grado empresarial y proyectos de IA / 1calle Edición

Escrito por: Neal Fishman, Cole Stryker y Grady Booch

  • Editorial: Wiley
  • Fecha publicada: 14 de abril de 2020
  • Idioma: inglés
  • No. de páginas: 286

Contenido: escalando la escalera AI; Enmarcado Parte I: Consideraciones para organizaciones que usan AI; Enmarcado Parte II: Consideraciones para trabajar con datos e IA; Una mirada hacia atrás en Analytics: más de un martillo; Esperamos el análisis: no todo puede ser un clavo; Abordar disciplinas operativas en la escalera de IA; Maximizar el uso de sus datos: estar impulsado por el valor; Valorar datos con análisis estadístico y habilitar acceso significativo; Construyendo a largo plazo; Un final de viaje: un IA para AI.

Aprendizaje automático: una perspectiva probabilística (Serie de computación adaptativa y aprendizaje automático) Edición ilustrada

Escrito por: Kevin P. Murphy

  • Editorial: The MIT Press
  • Fecha publicada: 24 de agosto de 2012
  • Idioma: inglés
  • Dimensiones: 8.25 x 1.79 x 9.27 pulgadas
  • No. de páginas: 1104

Este libro es bueno para principiantes. Una vez más, como todo el resto de los libros prescritos en este documento, este libro no cubre todo lo necesario para el programa generalista que, desafortunadamente, aún no está finalizado (los programas especializados aún no están finalizados). El principiante típico aquí es un graduado de secundaria con un pase en matemáticas e informática.

Contenido: Introducción (aprendizaje automático: qué y por qué?, Aprendizaje no supervisado, algunos conceptos básicos en el aprendizaje automático); Probabilidad; Modelos generativos para datos discretos; Modelos gaussianos; Estadísticas bayesianas; Estadísticas frecuentistas; Regresión lineal; Regresión logística; Modelos lineales generalizados y la familia exponencial; Modelos gráficos dirigidos (redes de Bayes); Modelos de mezcla y el algoritmo EM; Modelos lineales latentes; Modelos lineales dispersos; Núcleos; Procesos gaussianos; Modelos de función de base adaptativa; Modelos Markov y Markov ocultos; Modelos espaciales de estado; Modelos gráficos no dirigidos (campos aleatorios de Markov); Inferencia exacta para modelos gráficos; Inferencia variacional; Más inferencia variacional; Inferencia de Monte Carlo; Inferencia de la cadena de Markov Monte Carlo (MCMC); Agrupación; Aprendizaje de la estructura del modelo gráfico; Modelos variables latentes para datos discretos; Aprendizaje profundo.

Data Science for Business: lo que necesita saber sobre la minería de datos y el pensamiento analítico de datos / primera edición

Escrito por: Tom Fawcett y Foster Provost

  • Editorial: O'Reilly Media
  • Fecha publicada: 17 de septiembre de 2013
  • Idioma: inglés
  • Dimensiones: 7 x 0.9 x 9.19 pulgadas
  • No. de páginas: 413

Contenido: pensamiento analítico de datos; Problemas comerciales y soluciones de ciencia de datos; Introducción al modelado predictivo: de la correlación a la segmentación supervisada; Ajustar un modelo a los datos; Sobreajuste y su evitación; Similitud, vecinos y grupos; Pensamiento analítico de decisión I: ¿Qué es un buen modelo??; Visualizar el rendimiento del modelo; Evidencia y probabilidades; Texto de representación y minería; Pensamiento analítico de decisión II: Hacia la ingeniería analítica; Otras tareas y técnicas de ciencia de datos; Ciencia de datos y estrategia comercial; Conclusión.

https: // www.Amazonas.com/data-ciencia-negocio-data-analítico-pensamiento/dp/b08vl5k5zx

Estadísticas prácticas para científicos de datos: más de 50 conceptos esenciales utilizando R y Python / 2nd Edition

Escrito por: Peter Bruce, Andrew Bruce y Peter Gedeck

  • Editorial: O'Reilly Media
  • Fecha publicada: 2 de junio de 2020
  • Idioma: inglés
  • Dimensiones: 7 x 0.9 x 9.1 pulgada
  • No. de páginas: 368

Contenido: análisis de datos exploratorios, distribuciones de datos y muestreo, experimentos estadísticos y pruebas de significancia, regresión y predicción, clasificación, aprendizaje automático estadístico, aprendizaje no supervisado.

El libro de por qué: la nueva ciencia de la causa y el efecto

Escrito por: Judea Pearl, Dana Mackenzie

  • Editorial: libro básico
  • Fecha publicada: 15 de mayo de 2018
  • Idioma: inglés
  • Dimensiones: 6.3 x 1.4 x 9.4 pulgadas
  • No. de páginas: 432

Mientras que muchos libros de ciencias de datos utilizan la industria empresarial pura para ilustración, este libro utiliza la industria médica y otras disciplinas para la ilustración.

Contenido: Introducción: Mente sobre datos; La escalera de la causalidad; De bucaneros a conejillos de indias: la génesis de la inferencia causal; De la evidencia a las causas: el reverendo Bayes se encuentra con el Sr. Holmes; Confunding y desconfunding: o, matando a la variable de acecho; El debate lleno de humo: despejar el aire; Paradojas en abundancia!; Más allá del ajuste: la conquista de la intervención de montaje; Contrafactuals: mundos mineros que podrían haber sido; Mediación: la búsqueda de un mecanismo; Big data, inteligencia artificial y las grandes preguntas.

Construir una carrera en ciencia de datos

Escrito por: Emily Robinson y Jacqueline Nolis

  • Editorial: Manning
  • Fecha publicada: 24 de marzo de 2020
  • Idioma: inglés
  • Dimensiones: 7.38 x 0.8 x 9.25 pulgadas
  • No. de páginas: 354

Contenido: comenzar con la ciencia de datos; Encontrar su trabajo de ciencia de datos; Establecerse en la ciencia de datos; Creciendo en su papel de ciencia de datos.

https: // www.manifestante.com/books/build-a-coreer-in-Data-Science

Data Science for Dummies / 2da edición

Escrito por: Lillian Pierson

  • Editorial: para muñecos
  • Fecha publicada: 6 de marzo de 2017
  • Idioma: inglés
  • Dimensiones: 7.3 x 1 x 9 pulgadas
  • No. de páginas: 384

Este libro supone que el lector ya tiene el conocimiento previamente requerido de las matemáticas y la programación.

Contenido: envolviendo la cabeza de la ciencia de datos; Explorar tuberías e infraestructura de ingeniería de datos; Aplicar información basada en datos a las empresas y la industria; Aprendizaje automático: aprender de los datos con su máquina; Matemáticas, probabilidad y modelado estadístico; Utilizando la agrupación para subdividir los datos; Modelado con instancias; Creación de modelos que operan dispositivos de Internet de las cosas; Siguiendo los principios del diseño de visualización de datos; Usando D3.JS para la visualización de datos; Aplicaciones basadas en la web para el diseño de visualización; Explorar las mejores prácticas en el diseño del tablero; Hacer mapas a partir de datos espaciales; Uso de Python para la ciencia de datos; Uso de Open Source R para ciencia de datos; Uso de SQL en ciencia de datos; Hacer ciencia de datos con Excel y Knime; Ciencia de datos en periodismo: clavando las cinco WS (y una H); Profundizar en la ciencia de datos ambientales; Ciencia de datos para impulsar el crecimiento del comercio electrónico; Utilizando ciencia de datos para describir y predecir la actividad criminal; Diez recursos fenomenales para datos abiertos; Diez herramientas y aplicaciones de ciencia de datos gratuitas.

Minería de conjuntos de datos masivos / 3rd Edición

Escrito por: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Editorial: Cambridge University Press
  • Fecha publicada: 13 de febrero de 2020
  • Idioma: inglés
  • Dimensiones: 7 x 1 x 9.75 pulgadas
  • No. de páginas: 565

Este libro también supone que el lector ya tiene el conocimiento previamente requerido de las matemáticas y la programación.

Contenido: minería de datos; MapReduce y la nueva pila de software; Algoritmos usando MapReduce; Encontrar elementos similares; Flujos de datos mineros; Análisis de enlace; Conjuntos de elementos frecuentes; Agrupación; Publicidad en la web; Sistemas de recomendación; Gráficos mineros de red social; Reducción de dimensionalidad; Aprendizaje automático a gran escala.

Conclusión

Las distinciones entre los programas de especialistas aún no están claras. Las distinciones entre los programas generalistas y especialistas tampoco están claras. Sin embargo, después de leer la lista dada de libros, el lector estará en condiciones de apreciar mejor los roles especiales del analista de datos, la ingeniería de datos y el científico de datos, y luego avanzar.