BIG DATA
1 Libro Autor Walter Sosa Escudero
Editor Siglo XXI
PRIMERA EDICIÓN 2022
LIBRO POR ENCARGO
BREVE MANUAL PARA CONOCER LA CIENCIA
DE DATOS QUE YA INVADIÓ NUESTRAS VIDAS
Cada
vez que deslizamos nuestros dedos por una pantalla e ingresamos a una página
web para hacer una compra o buscar una dirección, cada vez que hacemos un
posteo, damos un like o subimos una foto a las redes sociales, cada vez que
usamos la tarjeta de crédito, el GPS, cada vez que… estamos generando datos,
¡cantidades espeluznantes de datos espontáneos! (de hecho, en los últimos dos
años la humanidad produjo más datos que en toda su historia previa)
¿Adónde
van parar?
¿Quién
los analiza, los procesa, los usa y para qué?
¿Acaso
nos espían?
¿Cómo
afectan nuestra vida?
Ante
este tsunami, el gran Walter Sosa Escudero nos inicia en el revolucionario
mundo de big data, la explosión originada por la masividad de internet, que
provee información instantánea acerca del comportamiento de miles de millones
de usuarios
Pero
tan importantes como los datos son los algoritmos, las técnicas estadísticas y
computacionales que permiten procesarlos; por eso este libro: BIG DATA; nos presenta la nueva ciencia de datos, una
disciplina que involucra la estadística, la matemática, la computación, el
diseño y todas las áreas de la vida cotidiana que dependen de los datos: desde
la política y la sociología hasta la medicina o la física, desde la empresa
hasta el Estado
Además
de presentar interesantes casos y métodos -el escándalo de los porno impuestos
en Noruega, el garrafal error del Literary Digest en la elección de Roosevelt,
la app para generar un mapa con los baches de la ciudad de Boston, o el famoso
padre que se entera por un algoritmo de que su hija está embarazada- y ante el
optimismo a ultranza de algunos gurúes de big data, nuestro autor también se
pregunta si esta catarata de información será capaz de cambiar radicalmente
nuestra forma de ver y vivir en el mundo
En
un tono coloquial pero con máximo rigor científico, este libro: BIG DATA; ofrece un paseo guiado por el aguacero de
datos y algoritmos. No presupone ninguna formación técnica, tan solo la
curiosidad de saber qué promete esta batalla, que unos ven como el comienzo de
una nueva era y otros, como el mal que viene a destruir nuestra vida cotidiana
ESTE LIBRO (Y ESTA COLECCIÓN)
Cubriéndonos,
cegándonos, matándonos /
desde
las mesas, desde los bolsillos, /
los
números, los números, / los números.
Pablo
Neruda, “Una mano hizo el número”
Si
viene la lluvia, / ellos corren y esconden
sus
cabezas.
Los Beatles, “Rain”
Hay
conceptos que duran un día, y pueden ser buenos
Hay
otros que están de moda, y no sabemos qué son. Y hay, claro, los que duran toda
la vida, los que son imprescindibles, los que nos cuentan de tal manera que se
nos enciende un “ajá” en el cerebro y de pronto la vida cambia. Entre estos,
seguro escucharon hablar de “big data”, grandes datos, datos masivos, datos
hasta en la sopa. Llueven datos y no siempre tenemos las cucharas para
recibirlos y degustarlos
Vamos
a los datos, a los números, entonces. Según un estudio de la consultora Cumulus
Media, en un minuto de internet 900 000 personas se conectan a Facebook, 3,5
millones de usuarios realizan búsquedas en Google, se envían 452 000 tuits, se reproducen 4,1 millones de horas de video en YouTube, se
miran 70 000 horas de contenido de Netflix y se suben unas 46 200 fotos a Instagram.
Sí, en un minuto de internet. Esto, por supuesto, genera una cantidad de
información inusitada, inaudita… imposible. Pero a estas tres “I” se les oponen
las tres “V” de esta nueva ciencia de los datos: volumen, velocidad y variedad.
En otras palabras: a grandes datos, grandes métodos para analizarlos y grandes
memorias para guardarlos. La cantidad de información da tortícolis: se dice que
un exabyte alcanzaría para registrar todas las palabras pronunciadas por todos
los humanos que hayan existido. Más aún: la mayor parte de esta catarata de
datos se crea porque sí, por generación espontánea, cada vez que hacemos algo
que involucra una transacción, registro o aparatito digital. En el medio,
predicciones de epidemias o cambios climáticos, datos sociales y hombres de la
bolsa.
Entre
tal maraña lo más obvio (quizá hasta lo indicado) es perderse, como Tony y
Douglas en el “El túnel del tiempo” (millennials abstenerse) o Neo dentro de la
Matrix. Pero cual mago del orden en nuestras cajoneras, por fortuna aparece el
mejor guía de este infierno encantador: el inigualable Walter Sosa Escudero nos
lleva de la mano entre números y estadísticas, entre algoritmos y computadoras
que aprenden sobre nosotros
Pero
este no es solo un libro de datos; como no podía ser de otra manera tratándose
de Walter, es además un libro de rock and roll. Por sus páginas viajamos de
gobiernos abiertos a Elvis y Bill Haley, de la gran epidemia de gripe A (y sus
huellas digitales) a Jimi Hendrix y Eric Clapton. Aunque hay para todos los
gustos: también tenemos historias de inteligencia artificial regadas por Air
Supply, A-ha o Rubén Blades
Es
que en esta nueva ciencia de datos (de muchos datos) entra todo. El análisis de
la personalidad extraído de una minuciosa búsqueda de millones de usuarios en Twitter.
Mapas detallados del cerebro basados en los billones de conexiones de las
neuronas. Planos del comportamiento criminal en las grandes ciudades (que
ayudan a combatir y reducir esos crímenes de manera que, por una vez, la
caballería ya no llegue tarde). Manejo de crisis y catástrofes naturales sobre
la base de la información que se genera “sola” cuando millones de personas comparten
opiniones y anuncios. Y, en el medio, nosotros, hormiguitas en el mundo de los
datos tratando de encontrarle algún sentido a esta inundación que amenaza con
taparnos los ojos y marearnos el futuro
Pero
no: Walter lo logra, una vez más, y nos rescata justo a tiempo para entender,
nada menos, dónde estamos, adónde vamos y, quizá, adónde queremos ir. Llueven
datos, sí, pero en estas páginas están las cucharas,
los
paraguas y las plantas para aprovechar la lluvia
Esta
colección de divulgación científica está escrita por científicos que creen que
ya es hora de asomar la cabeza por fuera del laboratorio y contar las
maravillas, grandezas y miserias de la profesión. Porque de eso se trata: de contar,
de compartir un saber que, si sigue encerrado, puede volverse inútil.
Ciencia
que ladra… no muerde, solo da señales de que cabalga
Diego
Golombek
INTRODUCCIÓN ACUÍFERA
−Buen
día, pase y tome asiento. ¿Cómo le va?
Cuénteme,
¿qué lo trae por aquí?
−
¡Doctor, veo datos por todas partes! Que si doy
“me
gusta” a una foto en Facebook, que si busco
una dirección en Google, que no sé cuántos kilómetros
corrió un jugador de fútbol
en el último partido,
que
si volví en tren en vez de volver en auto, ¡datos,
datos,
datos y más datos!
−Tranquilícese,
esta cuestión de la ciencia de datos,
los
algoritmos, las computadoras y las estadísticas
se
nos ha ido de las manos a todos.
−Ah,
¿mal de muchos, consuelo de tontos?
¿No
le parece otro argumento estadístico?
¡¡Ayúdeme!!
Llueven
datos. De redes sociales, tarjetas de crédito, teléfonos celulares, páginas web
y sus buscadores, dispositivos de GPS, relojes inteligentes, rastreadores
satelitales, análisis clínicos, cámaras de fotos y cualquier otro objeto
interconectado electrónicamente. Y ante tanta lluvia, las reacciones son
dispares. Hay quienes buscan guarecerse; algunos quieren recoger el agua con
una cuchara, mientras otros piensan en enormes tanques; algunos, en extraños
dispositivos para transformarla en otra cosa y otros simplemente no hacen nada,
fieles a eso de que “siempre que llovió, paró”. Desde la perspectiva de los
datos, las cucharas, los pilotos, los paraguas, los contenedores y los
procesadores químicos de lluvia son las técnicas utilizadas para analizarlos y
convertir este diluvio en conocimiento relevante, y juegan un rol tan importante
o más que la información.
Este
libro: BIG DATA; ofrece un paseo guiado por el
aguacero de datos y algoritmos. No presupone ninguna formación técnica, tan
solo la curiosidad por saber qué promete esta batalla de información, fórmulas
y computadoras, que unos ven como el comienzo de una nueva era y otros como una
moda pasajera. Al respecto, adoptaremos una postura optimista y a la vez
sincera: destacaremos tanto el enorme potencial de esta tormenta de datos como
sus dificultades. Mojaremos nuestros pies en el mar de big data, surfearemos
sus olas con innovadores algoritmos y navegaremos a bordo del poderoso buque de
la estadística. Además de presentar un muestrario de casos, los invitamos a
pensar acerca de si esta catarata de información será capaz de cambiar
radicalmente nuestra forma de ver el mundo y cómo convivirá con los métodos
tradicionales de la ciencia
Terminaremos
el recorrido empapados de historias de exitosos navegantes de datos y también
de naufragios épicos. Regresaremos chorreando aprendizaje automático, petas,
yottas, clasificación, regularización, Python, R, validación cruzada, árboles,
redes neuronales, clústers y otros esoterismos de la jerga de los valientes
marineros de la información. Escucharemos las historias de los jóvenes
científicos de datos trepados a sus veloces motos de agua, y nos deleitaremos
con las anécdotas de los capitanes de la estadística, aferrados al timón de sus
navíos
El
plan de acción es el siguiente:
El capítulo 1 arranca
con una breve “ducha” en la que intentamos aclarar qué es esto de big data y los algoritmos, y qué rol juega la
estadística en esta historia
El crucero sigue, en el capítulo 2, con algunas experiencias de
análisis de datos en la sociedad moderna
El capítulo 3 es
una primera “clase de natación” sobre algoritmos y métodos
Habiendo aprendido algunas maniobras básicas, el
capítulo 4 invita a recorrer nuevas
historias de datos con más detalle, como si fuésemos a nadar con los delfines
que en el capítulo 2 apenas veíamos desde la
cubierta
El capítulo 5 indaga
en las técnicas más recientes de aprendizaje. Luego, para ir secándonos de
tanto remojón, tomaremos distancia y discutiremos las limitaciones del análisis
de datos en la sociedad moderna, en el capítulo 6
El capítulo 7 reflexiona
sobre el futuro de los datos y los algoritmos. Cada capítulo comienza con un
breve diálogo que tal vez remita al lector a Karate Kid, Kung Fu o a las
sesiones semanales con su analista, y concluye con una breve sección titulada
“Da capo” (una instrucción musical que indica al interprete volver al principio
de la partitura) que ofrece alguna reflexión a modo de resumen
Una
aclaración: evité tercamente las notas al pie y las citas bibliográficas que
usualmente pueblan los libros de texto y los papers científicos para no
interrumpir el flujo de la lectura. El apéndice contiene todas las referencias y
fuentes utilizadas en este libro: BIG DATA
“¿Quién va a parar la lluvia?” cantaba John Fogerty en los sesenta. La lluvia de big data, parece que nadie, por eso los invito a unirse a esta humilde arca de Noé
ÍNDICE:
Este
libro (y esta colección)
Agradecimientos
Introducción
acuífera
1.
= Perdidos
en el océano de datos
= Big
data, aprendizaje automático, ciencia de datos,
estadística
y otras yerbas
= El
Elvis Presley de la ciencia de datos (vida, muerte,
resurrección
y nueva muerte de Google Flu Trends)
= ¿De
qué hablamos cuando hablamos de big data?
=Los
amplificadores de big data van hasta
= La
máquina de aprender
= Ireneo
Funes va a Harvard
= Da
capo
2.
= Livin’
la vida data. Historias de datos
y
algoritmos en la sociedad
=
¡Que vuelvan los (iPhones) lentos!
= Datactivismo,
orden y progreso
= Un
oasis de agua dulce en medio del mar de datos
=Big
data y la medición de la pobreza en Ruanda
= Da
capo
3.
= Una
nueva ferretería para el aluvión de datos.
= Herramientas,
técnicas y algoritmos
= Ordenando
el “segundo cajón de la cocina”
(análisis de clústers)
= Los
Rolling Stones del análisis de datos (regresión)
= Nadie
zafó del hundimiento del Titanic
(árboles decisorios)
= Da
capo
4.
= Gran
Hermano, gran data
= Datos
y algoritmos hasta en la sopa
= El
desafío Netflix del millón de dólares
= Letra
de médico (OCR)
= Revoleando
piedrazos con la mano invisible
= Nga
këto plazhe të bukura
= Da
capo
5.
= Cajas
negras para magia blanca
= Más
herramientas para el aprendizaje automático
= Pescar
en una pecera (complejidad y regularización)
= El
test de Chuck Norris (validación cruzada)
= La
leyenda de Ícaro (la maldición de la dimensionalidad)
= Aprendizaje
profundo (redes neuronales)
= Da
capo
6.
= No
todo lo que brilla es oro
= La
letra chica de los datos y los algoritmos
=Señor,
su hija está un poquito embarazada:
datos y privacidad
= Porno
impuestos en Noruega: datos y transparencia
= Millones
de moscas no pueden estar equivocadas:
big data y poca información
= El
“efecto Styx”: datos y sesgos de uso
=La
datamanía cada tanto encuentra hombres
embarazados:
big data y la falacia de la correlación
= Revoleando
bitcoins para dirimir cuestiones sociales:
datos, algoritmos y comunicabilidad
= Da
capo
7.
=
Puedo ver crecer el pasto
= El
futuro del futuro de los datos
= Big
data no es todos los datos
= ¿Quiero
tener un millón de amigos?
= Right
data
= Titanes
en el ring de los datos
= Da
capo
= Comentarios
finales, ya sobre tierra firme
= Referencias
comentadas
= Bibliografía
comentada
FICHA TÉCNICA:
1
Libro
208
Páginas
En
formato de 21 por 14 por 1.05 cm
Pasta
delgada en color plastificada
Primera
edición 2019
De
la Colección Ciencia que Habla
ISBN
9789876298995
Autor
Walter Sosa Escudero
Editor
Siglo XXI
FAVOR DE PREGUNTAR
POR EXISTENCIAS EN:
Correo
electrónico:
Celular:
6671-9857-65
Gracias
a Google por publicarnos
Quedamos
a sus órdenes
=
= = = = = = = = = = = = = =
1 comentario:
Libro BIG DATA
Gracias, estamos listos para atender
su petición en el Teléfono:
6677-146-961
Teléfono: 800-832-7697 llamada gratis en nuestro país;
CELULAR + 6671 – 985 - 765
WHATSAPP + 521 6671-9857-65
En el correo: alfonsomonarrez@gmail.com
Libro BIG DATA
Publicar un comentario