Aprende los fundamentos de TensorFlow y Deep Learning con Python

Aprende los fundamentos de TensorFlow y Deep Learning con Python

un curso interesante que te permitirá aprender los fundamentos de TensorFlow y del deep learning a través de Python. El curso está en inglés, pero como el subtitulado es fácil para gente que no domine la lengua inglesa de poder seguir.

Aprende los fundamentos de TensorFlow y Deep Learning con Python Parte I

¿Listo para aprender los fundamentos de TensorFlow y el aprendizaje profundo con Python? Bueno, has venido al lugar correcto.

Después de esta introducción en dos partes, habrás escrito cientos de líneas de código TensorFlow y tendrás experiencia práctica con dos problemas importantes en el aprendizaje automático: regresión (predecir un número) y clasificación (predecir si algo es una cosa u otra).

Abre una ventana de Google Colab (si no estás seguro de lo que es, pronto lo sabrás) y prepárate para codificar.


Consigue todo el código/materiales en GitHub – https://www.github.com/mrdbourke/tens…
Haz una pregunta – https://github.com/mrdbourke/tensorfl…
Ver parte 2 – https://youtu.be/ZUKz4125WNI
Documentación de TensorFlow Python – https://www.tensorflow.org/api_docs/p…

Marcas de tiempo:
0:00 – Introducción/hola/cómo enfocar este vídeo
1:50 – INICIO DEL MÓDULO 0 (fundamentos de TensorFlow/aprendizaje profundo)
1:53 – [Keynote] 1. ¿Qué es el aprendizaje profundo?
6:31 – [Keynote] 2. ¿Por qué utilizar el aprendizaje profundo?
16:10 – [Keynote] 3. ¿Qué son las redes neuronales?
26:33 – [Keynote] 4. ¿Para qué se utiliza realmente el aprendizaje profundo?
35:10 – [Keynote] 5. ¿Qué es y por qué usar TensorFlow?
43:05 – [Keynote] 6. ¿Qué es un tensor?
46:40 – [Keynote] 7. Qué vamos a cubrir
51:12 – [Keynote] 8. Cómo enfocar este curso
56:45 – 9. Creando nuestros primeros tensores con TensorFlow
1:15:32 – 10. Creación de tensores con tf Variable
1:22:40 – 11. Creación de tensores aleatorios
1:32:20 – 12. Barajar el orden de los tensores
1:42:00 – 13. Creación de tensores a partir de matrices NumPy
1:53:57 – 14. 14. Obtención de información de nuestros tensores
2:05:52 – 15. Indexación y expansión de tensores
2:18:27 – 16. Manipulación de tensores con operaciones básicas
2:24:00 – 17. Multiplicación de matrices parte 1
2:35:55 – 18. Multiplicación de matrices parte 2
2:49:25 – 19. Multiplicación de matrices parte 3
2:59:27 – 20. Cambio del tipo de datos de los tensores
3:06:24 – 21. 21. Agregación de tensores
3:16:14 – 22. Solución de problemas con tensores
3:22:27 – 23. Encontrar el mínimo y el máximo posicional de un tensor
3:31:56 – 24. 24. Exprimir un tensor
3:34:57 – 25. 25. Codificación de tensores en caliente
3:40:44 – 26. Probando más operaciones matemáticas con tensores
3:45:31 – 27. 27. Uso de TensorFlow con NumPy
3:51:14 – INICIO DEL MÓDULO 1 (regresión de redes neuronales)
3:51:25 – [Keynote] 28. Introducción a la regresión de redes neuronales con TensorFlow
3:58:57 – [Keynote] 29. Entradas y salidas de un modelo de regresión
4:07:55 – [Keynote] 30. Arquitectura de un modelo de regresión de red neuronal
4:15:51 – 31. Creación de datos de regresión de muestra
4:28:39 – 32. Pasos en la modelización con TensorFlow
4:48:53 – 33. Pasos para mejorar un modelo parte 1
4:54:56 – 34. Pasos para mejorar un modelo parte 2
5:04:22 – 35. Pasos para mejorar un modelo, parte 3
5:16:55 – 36. Evaluación de un modelo parte 1 (“visualizar, visualizar, visualizar”)
5:24:20 – 37. Evaluación de un modelo parte 2 (los 3 conjuntos de datos)
5:35:22 – 38. Evaluación de un modelo parte 3 (resumen del modelo)
5:52:39 – 39. Evaluación de un modelo parte 4 (visualización de las capas)
5:59:56 – 40. Evaluación de un modelo parte 5 (visualización de predicciones)
6:09:11 – 41. Evaluación de un modelo parte 6 (métricas de evaluación de la regresión)
6:17:19 – 42. Evaluación de un modelo de regresión parte 7 (MAE)
6:23:10 – 43. Evaluación de un modelo de regresión parte 8 (MSE)
6:26:29 – 44. Experimentos de modelización parte 1 (empezar con un modelo sencillo)
6:40:19 – 45. Experimentos de modelización parte 2 (aumento de la complejidad)
6:51:49 – 46. Comparación y seguimiento de experimentos
7:02:08 – 47. Guardar un modelo
7:11:32 – 48. Cargar un modelo guardado
7:21:49 – 49. Guardar y descargar archivos de Google Colab
7:28:07 – 50. 50. Reunir lo que hemos aprendido 1 (preparar un conjunto de datos)
7:41:38 – 51. Reunir lo que hemos aprendido 2 (construir un modelo de regresión)
7:55:01 – 52. 52. Reunir lo que hemos aprendido 3 (mejorar nuestro modelo de regresión)
8:10:45 – [Código] 53. Preprocesamiento de datos 1 (conceptos)
8:20:21 – [Código] 54. Preprocesamiento de datos 2 (normalización de datos)
8:31:17 – [Código] 55. Preprocesamiento de datos 3 (ajuste de un modelo en los datos normalizados)
8:38:57 – INICIO DEL MÓDULO 2 (clasificación con redes neuronales)
8:39:07 – [Keynote] 56. Introducción a la clasificación de redes neuronales con TensorFlow
8:47:31 – [Keynote] 57. Entradas y salidas de la clasificación
8:54:08 – [Keynote] 58. Formas del tensor de entrada y salida de la clasificación
9:00:31 – [Keynote] 59. Arquitectura típica de un modelo de clasificación
9:10:08 – 60. Creación y visualización de datos de clasificación para el modelo
9:21:39 – 61. Comprobación de las formas de entrada y salida de nuestros datos de clasificación
9:26:17 – 62. Construyendo un modelo de clasificación no muy bueno
9:38:28 – 63. 63. Intentando mejorar nuestro modelo de clasificación no muy bueno
9:47:42 – 64. Creación de una función para visualizar las predicciones no tan buenas de nuestro modelo
10:02:50 – 65. Haciendo que nuestro pobre modelo de clasificación funcione para un conjunto de datos de regresión

Aprende los fundamentos de TensorFlow y Deep Learning con Python Parte II

Has llegado a la segunda parte de la serie de vídeos más larga de aprendizaje profundo y TensorFlow en YouTube.

Esta parte continúa justo donde lo dejó la primera, así que abre la ventana de Google Colab y prepárate para escribir mucho más código TensorFlow.


Consigue todo el código/materiales en GitHub – https://www.github.com/mrdbourke/tens…
Haz una pregunta – https://github.com/mrdbourke/tensorfl…
Ver parte 1 – https://youtu.be/tpCFfeUEGs8
Documentación de TensorFlow Python – https://www.tensorflow.org/api_docs/p…

Marcas de tiempo:
0:00 – Introducción/hola/¿Has visto la parte 1? Si no, deberías
0:55 – 66. No linealidad parte 1 (líneas rectas y no rectas)
10:33 – 67. No linealidad parte 2 (construir nuestra primera red neuronal con una función de activación no lineal)
16:21 – 68. No linealidad parte 3 (mejorando nuestro modelo no lineal con más capas)
26:40 – 69. No linealidad parte 4 (modelando nuestros datos no lineales)
35:18 – 70. No linealidad parte 5 (reproduciendo nuestras funciones no lineales desde cero)
49:45 – 71. Conseguir grandes resultados en menos tiempo ajustando la tasa de aprendizaje
1:04:32 – 72. Uso del objeto histórico para trazar las curvas de pérdida de un modelo
1:10:43 – 73. Utilizar las devoluciones de llamada para encontrar la tasa de aprendizaje ideal de un modelo
1:28:16 – 74. Entrenamiento y evaluación de un modelo con una tasa de aprendizaje ideal
1:37:37 – [Nota clave] 75. Introducción de más métodos de clasificación
1:43:41 – 76. 76. Encontrar la precisión de nuestro modelo
1:47:59 – 77. 77. Creación de nuestra primera matriz de confusión
1:56:27 – 78. Hacer más bonita nuestra matriz de confusión
2:10:28 – 79. Clasificación multiclase parte 1 (preparación de los datos)
2:21:04 – 80. Clasificación multiclase, parte 2 (hacerse uno con los datos)
2:28:13 – 81. Clasificación multiclase, parte 3 (creación de un modelo multiclase)
2:43:52 – 82. Clasificación multiclase, parte 4 (mejorar nuestro modelo multiclase)
2:56:35 – 83. Clasificación multiclase, parte 5 (normalizada y no normalizada)
3:00:48 – 84. Clasificación multiclase parte 6 (encontrar la tasa de aprendizaje ideal)
3:11:27 – 85. Clasificación multiclase, parte 7 (evaluación de nuestro modelo)
3:25:34 – 86. Clasificación multiclase, parte 8 (creación de una matriz de confusión)
3:30:00 – 87. Clasificación multiclase, parte 9 (visualización de muestras aleatorias)
3:40:42 – 88. ¿Qué patrones está aprendiendo nuestro modelo?

Traducción realizada con la versión gratuita del traductor www.DeepL.com/Translator

Los 7 mejores libros de ciencia de datos para principiantes

Los 7 mejores libros de ciencia de datos para principiantes


.

Los 7 mejores libros de ciencia de datos para llevarte desde principiante a master

En pleno auge del video sobre cualquier otro formato, muchos aspirantes a alguna profesión de futuro, se olvidan que entre tutoriales de youtube, webinars, cursos de udemy o de coursera, hay una herramienta de aprendizaje fenomenal que funcional desde hace siglos, que no necesita internet, ni electricidad, que es 100 movil y que se adapta al ritmo de cada uno.

EL LIBRO.

Los 7 mejores libros de ciencia de datos para principiantes
Photo by Pixabay on Pexels.com

Es cierto que no todos los libros y todos los autores son capaces de hacer del aprendizaje una experiencia fácil y divertida. En este listado os propongo 7 libros de 7 autores que merecen la pena leer para llevaros desde un simples principiante de la ciencia de datos a dominar el tema y poder aplicarla sin cualquier tipo de problemas.

1. The Python Data Science Handbook, de Jake VanderPlas, publicado por O’Reilly.

Los 7 mejores libros de ciencia de datos para principiantes

Este libro es ideal para aquellos que se están iniciando en el análisis de datos y la ciencia de los datos y necesitan un libro que haga referencia a todas las técnicas y características de la biblioteca y amplíe Python para la ciencia de los datos. El libro cubre una variedad de temas en detalle y en profundidad, incluyendo la manipulación de datos con IPython (Python Interactivo), Numpy y Pandas, la visualización con matplotlib, y los algoritmos de aprendizaje automático supervisado y no supervisado con scikit-learn La cantidad y la profundidad del contenido sobre estos temas es impresionante. La cantidad y la calidad de los contenidos sobre estos temas contribuirán en gran medida a proporcionar habilidades para iniciarse en el ciclo de proyectos de ciencia de datos.

2. Practical Statistics for Data Scientists, de Peter Bruce, Andrew Bruce y Peter Gedek, publicado por O’Reilly.

Los 7 mejores libros de ciencia de datos para principiantes

La segunda edición de este libro ya ha salido, pero personalmente creo que es beneficioso leer este libro incluso si estás empezando o eres un profesional. Porque las estadísticas son la base de la ciencia de datos, y es fácil olvidarla, este libro te permitirá adquirir muchas habilidades si no las tienes todavia, pero también permitirá refrescar algunas de las que no se han vuelto a utilizar desde que se ha aprendido..

Estos temas se incluyen en este libro. Este libro incluye temas como EDA, datos y distribuciones de muestreo, experimentos estadísticos y pruebas de significación, regresión, clasificación, ML estadístico y aprendizaje no supervisado. Si eres un principiante, lee primero el primer libro y luego salta a este libro para aprender un montón de nuevas habilidades en la ciencia de los datos.

3. Introducing Data Science, de Davy Cielen et.al, publicado por Manning.

Los 7 mejores libros de ciencia de datos para principiantes

Me gusta este libro porque no sólo cubre los temas omnipresentes de la ciencia de los datos, sino también otros aspectos del campo de la ciencia de los datos, como {bases de datos NoSQL, minería de textos, análisis de textos y cómo iniciarse en el Big Data, especialmente el manejo de grandes cantidades de datos en un solo ordenador el manejo de grandes cantidades de datos en un solo ordenador}. Entender y trabajar con la integración de bases de datos en proyectos de ciencia de datos es una habilidad realmente útil y demandada. Te recomiendo que leas este artículo y aprendas las habilidades mencionadas.

4. The Art of Statistics: Learning Statistics from Data, de David Spiegelhalter, Pelican Publications, Inc.

Los 7 mejores libros de ciencia de datos para principiantes

Este libro era la recomendación de un curso de Ciencia de Datos Aplicada en Coursera en la Universidad de Michigan. Este libro hace un importante enfoque en la importancia de la capacidad de visualización (o, más concretamente, del arte). Es un libro muy recomendable a cualquiera que quiera comprender la profundidad de la visualización de datos y aprender el arte de la visualización de datos.

5. Data Science from Scratch de Joel Grus (publicado por O’Reilly)

Los 7 mejores libros de ciencia de datos para principiantes

Ya en su segunda edición, este libro ha ganado popularidad porque combina una variedad de fundamentos en un solo libro. Comienza con un curso intensivo de Python y luego pasa a la visualización de datos, el álgebra lineal y la estadística, la probabilidad, las hipótesis y la inferencia, la adquisición y el uso de datos, y el aprendizaje automático, las redes neuronales y los sistemas de recomendación, el análisis de redes y muchos otros temas relacionados con los datos. Es una gran lectura, y esperamos que la disfrute.

6.R for Data Science por Hadley Wickham & Garrett Gromund, publicado por O’ Reilly

Los 7 mejores libros de ciencia de datos para principiantes

R es todavia uno de los lenguajes de programación más utilizados para ciencia de datos. Algo que podría no parecer el caso por las recomendaciones hasta el momento.

Este libro es para las personas que quieren conocer el lenguaje, y todas la infinidad de librerías disponibles, para que puedan probarlo Cualquiera que esté pensando en hacer algo divertido o nuevo en ciencia de datos, como aprender un nuevo lenguaje para una tarea de ciencia de datos, debería leer definitivamente este libro. En este libro lo aprenderá todo. Definitivamente, merece la pena echarle un vistazo.

7.Think Stats de Allen B. Downey, publicado por O’ Reilley

Los 7 mejores libros de ciencia de datos para principiantes

Think Stats es un prólogo a la Probabilidad y la Estadística para los desarrolladores de software y científicos de datos de Python (si no estás ya familiarizado con estos temas).

Think Stats le muestra métodos sencillos para explorar conjuntos de datos del mundo real y responder a preguntas interesantes. El libro presenta un análisis contextual utilizando datos de los Institutos Nacionales de Salud.

Si tiene los conocimientos básicos de Python, puede utilizarlo para aprender a pensar en la probabilidad y la estadística.Think Stats se basa en la biblioteca de distribuciones de probabilidad de Python. También incluye muchos ejercicios que permiten realizar diversos experimentos con programas cortos para profundizar en su comprensión.

Aunque muchos libros no cubren la estadística bayesiana, Think Stats destaca el potencial de las técnicas bayesianas como algo muy importante; mediante el uso de PMF y la biblioteca CDF (utilizada para las distribuciones de probabilidad), incluso los aficionados pueden familiarizarse con las ideas y abordar los problemas de pruebas posibles.

Introducción a la estadística para la ciencia de los datos

Introducción a la estadística para la ciencia de los datos. Una terminología básica

¿Eres un aspirante a científico de datos que quiere aprender estadística para fines de Ciencia de Datos? ¿Le resultaron difíciles los conceptos de estadística durante sus años escolares y está buscando una forma fácil de aprender los conceptos estadísticos para mejorar su capacidad de comprensión de los datos? Si su respuesta es “sí” a ambas cosas, ha llegado al lugar adecuado. Hoy le presentaremos algunos de los conceptos estadísticos comúnmente aceptados en el campo de la ciencia de los datos. Antes de aprender los conceptos, es importante saber qué se puede aprender.

Introducción a la estadística para la ciencia de los datos

Se trata de una introducción a la estadística y al aprendizaje automático.


¿Qué es la estadística? ¿Cuáles son los diferentes tipos de conceptos estadísticos que hay que conocer?

La estadística es una de las disciplinas más conocidas cuyo objetivo principal es recoger datos, organizarlos, analizarlos, interpretarlos y visualizarlos. En el pasado, la estadística era practicada por estadísticos, economistas y gestores para calcular y presentar datos relevantes en sus respectivos campos. Hoy en día, la estadística desempeña un papel central en varias disciplinas como la ciencia de los datos, el aprendizaje automático, el papel del analista de datos, el papel del analista de inteligencia empresarial y el papel de la informática.


Es cierto que hace tiempo que aprendimos ciertos conceptos estadísticos como la tendencia central y la desviación estándar. Hay muchos más conceptos estadísticos importantes que deben ser aprendidos e implementados para la Ciencia de Datos y el Aprendizaje Automático. Aprendamos algunos términos estadísticos básicos y su clasificación.

Terminología estadística básica


Para dominar un programa estadístico, es necesario conocer ciertos términos. Son los siguientes.

  • La población. Una población es un conjunto de recursos de los que se pueden recoger datos.
  • Ejemplo. Una muestra no es más que un subconjunto de una población y se utiliza para los datos de la muestra y la estadística inferencial para predecir resultados.
  • Variable. Una variable es un número, una característica o una cantidad contable. A veces se denominan puntos de datos.
  • Distribución de la probabilidad. Una distribución de probabilidad es un concepto matemático que indica la probabilidad de ocurrencia de varios resultados posibles, especialmente en los experimentos realizados por los estadísticos.
  • Parámetro estadístico. Un parámetro estadístico, o parámetro poblacional, es básicamente una cantidad utilizada para indexar un conjunto de distribuciones de probabilidad, como la media, la mediana y la moda de una población.

Tipos de conceptos en estadística

  1. Estadística descriptiva – La estadística descriptiva es un concepto de análisis y resumen de datos y su organización en forma de gráficos numéricos, gráficos de barras, histogramas, gráficos circulares, etc. La estadística descriptiva es el proceso de descripción de los datos existentes. Convierte los datos de observación en bruto en datos significativos que pueden interpretarse y utilizarse posteriormente. Conceptos como desviación estándar y tendencia central se utilizan en todo el mundo para estudiar la estadística descriptiva.
  2. 2. Estadística inferencial – La estadística inferencial es un concepto importante para sacar conclusiones a partir de una pequeña muestra de una población. Por ejemplo, para predecir el resultado de los sondeos a pie de urna en las elecciones, se pueden realizar encuestas en diferentes partes del estado o del país para recabar opiniones. Sobre la base de la información recopilada de este modo, tendemos a sacar conclusiones y hacer inferencias para predecir el resultado global.
    Ahora que conocemos los diferentes tipos de estadística, es sumamente importante reconocer el papel central del concepto de estadística en la ciencia de los datos y el aprendizaje automático y saber que son dos campos de estudio estrechamente relacionados. La estadística en la ciencia de los datos es realmente útil para seleccionar, evaluar e interpretar los modelos predictivos para los casos de uso de la ciencia de los datos.

Estadística y ciencia de los datos

Introducción a la estadística para la ciencia de los datos - Estadisticas y ciencia de datos - Analiticas
Introducción a la estadística para la ciencia de los datos – Estadisticas y ciencia de datos – Analiticas – Photo by Timur Saglambilek on Pexels.com

Los conceptos básicos del aprendizaje automático y la ciencia de los datos se basan en la estadística. Por ello, es importante aprender a fondo los fundamentos de la estadística para poder resolver problemas del mundo real.
Para aquellos que nunca han tenido nada que ver con la estadística, aquí hay algunos conceptos específicos que deben dominar para tener éxito en su viaje de Ciencia de Datos. A medida que se aprenden las fórmulas, las fórmulas estadísticas y las teorías, hay que familiarizarse con dónde aplicarlas. Sin duda es un tema difícil, pero que merece la pena aprender.
Desde el análisis exploratorio de datos hasta el diseño de pruebas de hipótesis, la estadística desempeña un papel importante en la resolución de muchos problemas en diversas industrias y campos, especialmente para los científicos de datos.

¿Por qué hay que dominar los conceptos de la estadística?


Hoy en día, la mayoría de las empresas se basan en los datos y utilizan varios conceptos para interpretar los datos disponibles. Aquí es donde entran en juego los conceptos estadísticos básicos y su aplicación ayuda a describir los datos en cuestión.
Para resolver los problemas actuales de la empresa y predecir mejores estrategias para mejorar la rentabilidad del negocio, es necesario aprender los conceptos que ayudan a entender los datos y a clasificarlos según sus propiedades. Afortunadamente, hay una serie de herramientas estadísticas que pueden ayudarle a organizar y visualizar sus datos para obtener información útil.
Por lo tanto, en este punto, es importante dominar los conceptos de la estadística. Hay muchos cursos en línea y libros que pueden ayudarte a profundizar en tus conocimientos y convertirte en un mejor científico de datos.

Cómo entender sus datos actuales

Introducción a la estadística para la ciencia de los datos - Como entender los datos actuales
Introducción a la estadística para la ciencia de los datos – Como entender los datos actuales – Photo by Serpstat on Pexels.com


Los datos no son más que un conjunto de observaciones que existen en sus sistemas internos. Puede utilizar la estadística descriptiva para recopilar, organizar, clasificar, muestrear y visualizar datos para tomar decisiones informadas para su negocio.
También puede utilizar la estadística inferencial para predecir resultados. Normalmente, este concepto se utiliza para realizar encuestas o estudios de mercado, que tienden a recoger una muestra de datos y predecir los resultados para toda la población de un lugar determinado en función de ella.
Estos son algunos de los conceptos que debes dominar para convertirte en un mejor profesional de la Ciencia de Datos.
Debe calcular y aplicar medidas de tendencia central para datos agrupados y no agrupados.
Debe dominar la síntesis, la presentación y la visualización de los datos para que los informes resultantes sean claros y proporcionen información práctica a las partes interesadas y a los propietarios de la organización.
También tendrá que realizar pruebas de hipótesis, que son necesarias cuando se trabaja con conjuntos de datos generales.
Realice rigurosas pruebas de correlación y análisis de regresión y presente los datos.
Utilizar R y Python para implementar conceptos estadísticos y demostrar el dominio de este programa.
Utilizar herramientas como Excel, Tableau y Power Bi para presentar los datos en un formato adecuado.

¿Qué importancia tienen las estadísticas en la vida cotidiana?

Introducción a la estadística para la ciencia de los datos - Mujer comprando en un supermercado
Vida Cotidiana – Photo by Anna Shvets on Pexels.com

Afortunadamente, las estadísticas pueden ayudarle a responder a preguntas importantes sobre sus datos, como por ejemplo

  • ¿Qué características de los datos son importantes para el desarrollo de modelos?
  • ¿Cuál es la mejor manera de realizar un experimento?
  • ¿Cómo diseñamos estrategias basadas en los resultados de nuestros experimentos?
  • ¿En qué medidas de rendimiento debemos centrarnos?
  • ¿Cómo interpretamos los resultados?
  • ¿Cómo se distinguen los datos válidos de los datos con ruido?
    Todas estas son preguntas comunes e importantes que tienen implicaciones estadísticas, y los equipos de datos necesitan responder a estas preguntas para realizar mejor su trabajo.
    Estos son algunos de los puntos clave que debe conocer para empezar a utilizar un programa estadístico. Hay una variedad de cursos disponibles para ayudarle a empezar a utilizar un programa estadístico.