Big data machine learning

aprendizaje profundo

En esencia, la ciencia de los datos es un campo de estudio cuyo objetivo es utilizar un enfoque científico para extraer significado y conocimientos de los datos. El Dr. Thomas Miller, de la Universidad Northwestern, describe la ciencia de los datos como «una combinación de tecnología de la información, modelización y gestión empresarial». Las universidades han reconocido la importancia del campo de la ciencia de los datos y han creado programas de posgrado en ciencia de los datos en línea.
El aprendizaje automático, por su parte, se refiere a un grupo de técnicas utilizadas por los científicos de datos que permiten a los ordenadores aprender de los datos. Estas técnicas producen resultados que funcionan bien sin necesidad de programar reglas explícitas.
Tanto la ciencia de los datos como el aprendizaje automático son palabras de moda hoy en día. Estos dos términos a menudo se lanzan juntos, pero no deben confundirse con sinónimos. Aunque la ciencia de los datos incluye el aprendizaje automático, es un campo muy amplio con muchas herramientas diferentes.
La proliferación de teléfonos inteligentes y la digitalización de muchas partes de la vida cotidiana han creado cantidades masivas de datos. Al mismo tiempo, la continuación de la Ley de Moore, la idea de que la computación aumentaría drásticamente en potencia y disminuiría en coste relativo con el tiempo, ha hecho que la potencia de computación barata esté ampliamente disponible. La ciencia de los datos es el vínculo entre estas dos innovaciones. Al combinar estos componentes, los científicos de datos pueden obtener más información de los datos que nunca antes.

análisis de regresión

Lo que aprenderásAprende másenDescripción del cursoQuizás las metodologías de ciencia de datos más populares provienen del aprendizaje automático. Lo que distingue al aprendizaje automático de otros procesos de decisión guiados por ordenador es que construye algoritmos de predicción utilizando datos. Algunos de los productos más populares que utilizan el aprendizaje automático incluyen los lectores de escritura a mano implementados por el servicio postal, el reconocimiento de voz, los sistemas de recomendación de películas y los detectores de spam.
En este curso, que forma parte de nuestro Programa de Certificación Profesional en Ciencia de Datos, aprenderá algoritmos populares de aprendizaje automático, análisis de componentes principales y regularización mediante la construcción de un sistema de recomendación de películas.
Aprenderá sobre los datos de entrenamiento y cómo utilizar un conjunto de datos para descubrir relaciones potencialmente predictivas. Mientras construye el sistema de recomendación de películas, aprenderá a entrenar algoritmos utilizando datos de entrenamiento para poder predecir el resultado de futuros conjuntos de datos. También aprenderá sobre el sobreentrenamiento y las técnicas para evitarlo, como la validación cruzada. Todas estas habilidades son fundamentales para el aprendizaje automático.

regresión logística

Randall Wald.Información adicionalIntereses concurrentesLos autores declaran que no tienen intereses concurrentes.Contribuciones de los autoresMMN realizó la revisión y el análisis de la literatura primaria para este trabajo, y también redactó el manuscrito. RW y NS trabajaron con MMN para desarrollar el marco y el enfoque del artículo. TMK, FV y EM presentó este tema a MMN y TMK coordinado con los demás autores para completar y finalizar este trabajo. Todos los autores leyeron y aprobaron el manuscrito final.Derechos y permisos
Acceso abierto Este artículo está licenciado bajo una Licencia Internacional de Atribución 4.0 de Creative Commons, que permite el uso, la compartición, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor o autores originales y a la fuente, se proporcione un enlace a la licencia de Creative Commons y se indique si se hicieron cambios.
Journal of Big Data 2, 1 (2015). https://doi.org/10.1186/s40537-014-0007-7Download citationShare this articleAnyone you share the following link with will be able to read this content:Get shareable linkSorry, a shareable link is not currently available for this article.Copy to clipboard

ciencia de los datos para la empresa…

¿Necesitas entender el big data y cómo va a impactar en tu negocio? Esta especialización es para ti. Usted ganará una comprensión de lo que los datos grandes pueden proporcionar a través de la experiencia práctica con las herramientas y sistemas utilizados por los científicos e ingenieros de datos grandes. No es necesario tener experiencia previa en programación. Se le guiará a través de los fundamentos del uso de Hadoop con MapReduce, Spark, Pig y Hive. Siguiendo el código proporcionado, experimentará cómo se puede realizar el modelado predictivo y aprovechar el análisis de gráficos para modelar problemas. Esta especialización le preparará para hacer las preguntas correctas sobre los datos, comunicarse eficazmente con los científicos de datos, y hacer la exploración básica de grandes y complejos conjuntos de datos. En el Proyecto Capstone final, desarrollado en colaboración con la empresa de software de datos Splunk, aplicarás las habilidades que has aprendido para hacer análisis básicos de big data.Preguntas frecuentes¿Más preguntas? Visita el Centro de Ayuda al Estudiante.