viernes, 15 de marzo de 2019



VERY BIG DATA

Análisis del artículo: Six Provocations for Big Data. A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society, boyd, d., & Crawford, K. (2011)

Six Provocations for Big Data 

El artículo nos introduce en el concepto de big data así como en sus particularidades, dejando claro que el abanico de ámbitos en los que se estudia su desarrollo no hace más que crecer. Teniendo en cuenta que el reporte tiene ya algunos años, podemos decir que hoy en día el uso de todas esas pequeñas referencias y movimientos  a los que llamamos big data producidos a diario sin a penas ser conscientes y en cantidades ingentes, es objeto de investigación ya no por celebres científicos e informáticos, sino por cualquier compañía o pequeña empresa que se precie. Cualquier disciplina que nos venga a la cabeza hará uso de esta bola de nieve o maraña informacional. 
Se plantean, en principio, diferentes objetivos a cumplir o interrogantes que cabría esperar por las perspectivas que abren los últimos avances en la investigación del big data, tales como mejoras en la cura de enfermedades, o posibles desigualdades en el reparto de estos medios; un acceso al conocimiento más preciso y efectivo pero a su vez un seguimiento y rastreo individual que acote nuestros movimientos. Estas y otras cuestiones se ponen sobre la mesa a lo largo del artículo que está dividido en seis puntos, provocaciones o expectativas derivadas del manejo del big data.
A continuación trataremos uno a uno los seis puntos del artículo y los reforzaremos con enlaces complementarios que se acercan más al momento presente.
  1. Investigación automatizada: Nueva definición de conocimiento
 Está claro que la manera en la que nos acercamos al conocimiento camba de manera radical y Chris Anderson, editor en jefe de Wired, escribe:
“Este es un mundo en el que cantidades masivas de datos y matemáticas aplicadas reemplazan a todas las otras herramientas que podrían aplicarse. Fuera con todas las teorías del comportamiento humano, desde la lingüística hasta la sociología. Olvídate de la taxonomía, la ontología y la psicología. ¿Quién sabe por qué la gente hace lo que hace? El punto es que lo hacen, y podemos rastrearlo y medirlo con una fidelidad sin precedentes. Con datos suficientes, los números hablan por sí mismos. (2008)”
Se plantea en este apartado de que manera google y los demás recolectores de datos pueden cambiar y transformar el modo en que aprendemos, así como las nuevas posibilidades que brindan estas aportaciones y sus límites.

Complementary link:

https://onlinelibrary.wiley.com/doi/full/10.15252/embr.201541001
El big data y el mito de una ciencia sin teoría. Autor: Mazzocchi Fulvio Embo Reports 16(10):1250-1255, Oct 2015.
Aquí encontramos una reflexión acerca del contraste entre el método tradicional científico de investigación para generar conocimiento consistente, formulación de una hipótesis, comprobación experimental y reformulación de acuerdo con los resultados experimentales obtenidos, y la investigación basada en los datos. Muchos investigadores han hecho notar que la generación de cantidades masivas de información podría volver obsoleto el método científico.

2.  Lo engañoso en la objetividad y  la precisión

La interpretación es inevitable a la hora de dar forma a tal cantidad de datos, así como la selección de los mismos y su filtrado; si se quiere realizar una lectura acertada tendremos que tener en cuenta los complejos procesos metodológicos que subyacen en el análisis de los datos sociales. 
'Números, números, números', escribe Latour (2010). "La sociología ha estado obsesionada por el objetivo de convertirse en una ciencia cuantitativa". Sin embargo, la sociología nunca ha alcanzado este objetivo, según Latour, debido a que marca la línea entre lo que es y no es el conocimiento cuantificable en el dominio social.

Complementary link:
Big Data, ¿solo datos? ¿Objetividad vs Subjetividad? Joels Hidalgo (2018)

En este ensayo el autor nos plantea la cuestión de la objetividad y la subjetividad. Por definición la condición humana es imperfecta, la imparcialidad total es algo difícil, por no decir imposible, de encontrar en las personas. Es por ello que se plantea la posibilidad de que el metadato recogido por una máquina carezca del tinte subjetivo.

3. El tamaño no es sinónimo de calidad

En este punto se deja claro que una gran cantidad de datos no significa que esos mismos datos vayan a ser más acertados o productivos. Se pone de manifiesto el ejemplo de redes sociales con mucho movimiento como es el caso de Twitter. 
Dadas las características propias del formato, perfil personal, seguidores, comentarios, y que además Twitter no representa a todo el mundo ya que su uso no está tan extendido, la utilización de estos datos tendrá que ser tratada con mucha precaución. En la era del giro computacional, es cada vez más importante reconocer el valor de los "datos pequeños". Las ideas de investigación se pueden encontrar en cualquier nivel, incluso a escalas muy modestas. En algunos casos, enfocarse solo en un solo individuo puede ser extraordinariamente valioso. Se cita el ejemplo de el trabajo de Tiffany Veinot (2007), quien siguió a un trabajador, un inspector de bóveda en una empresa de servicios hidroeléctricos, para comprender las prácticas de un trabajador de clase obrera.

Complementary link:

‘Big data’ no es tan listo como se cree, Sergio C. Fanjul (2016). El ‘smart data’ se basa en la calidad más que en la cantidad de la información para generar un valor añadido real en las actividades de las personas. El autor nos habla de que en la era de los datos, más que nunca, debemos ser conscientes que no todo es tan sencillo. Entre esos datos habrá que reconocer aquellos más adecuados (smart data) y no podremos delegar toda la responsabilidad en sus resultados. Al fin y al cabo lo importante es el uso que se haga del big data, y saber aprovechar su potencial.

4. Equivalencia de datos

Fuera de contexto los datos perderán su valor. El que dos grupos de datos se puedan generar de forma similar, no quiere decir que sean intercambiables. No podemos creer que los datos son genéricos y extrapolables. Este pensamiento erróneo viene dado del uso de big data cuando se cuenta con poca información veraz; este argumento supone también que los datos son equivalentes.

Complementary link:

Big Data Problems: Crash Course Statistics
 En este video realizado por la comunidad creativa de contenido Crash Course, se alerta de los problemas que se esconden tras la efusiva utilización del Big Data. Desde las cuestiones de sesgo y transparencia hasta las preocupaciones sobre la privacidad y la seguridad, todavía queda mucho por hacer para manejar estos problemas, ya que el metadata cada vez juega un papel más relevante en nuestras vidas.

5. Ética y accesibilidad

En este apartado se discuten los límites dentro del tratamiento y el mercantilismo de los datos. Cuando se analiza el flujo de miles de personas que frecuentan una plataforma virtual, su privacidad está siendo vulnerada, los fines de esa investigación pueden ser de dudosa procedencia, y lo que es peor, como en la red todo es público, puede darse el caso de que información personal llegue a manos de usuarios con perfil contradictorio, o simplemente queden a la luz datos de individuos que nunca han consentido tal investigación.
El hecho de que sea un a actividad accesible no quiere decir que sea ética y moralmente correcta si dejamos a un lado parámetros y permisos que ponen en alerta los derechos fundamentales de cualquier persona. 

Complementary link:

https://www.youtube.com/watch?v=NPE7i8wuupk
¿Por qué me vigilan, si no soy nadie? TED Madrid. Marta Peirano (2015)

Hoy todas nuestras llamadas, desplazamientos, reuniones y mucho más son meticulosamente registradas y revisadas por corporaciones, gobiernos e incluso delincuentes en enormes bases de datos que han dado vida a un nuevo campo de la informática: el Big Data. Sabemos que estamos vigilados, a través de nuestros móviles, ordenadores y cámaras. Pero no hacemos nada malo y por eso nos sentimos a salvo. Marta Peirano avisa en esta charla que es urgente preocuparse y proteger nuestro anonimato en la red.

6.  Nuevos artefactos que facilitan el acceso

En este último punto se hace referencia a la cita de Lev Manovich (2011), "solo las empresas de redes sociales tienen acceso a datos sociales realmente grandes, especialmente datos transaccionales. Un antropólogo que trabaje para Facebook o un sociólogo que trabaje para Google tendrá acceso a datos que el resto de la comunidad académica no tendrá". Entramos de lleno en un control y manejo de la información totalmente desigual, sólo tendrá acceso a esos datos aquellos que económicamente se lo puedan permitir. En el momento que el big data es la llave al conocimiento se le pone precio. Aquí nos encontraremos los ricos del big data y los pobres del big data.

Manovich (2011), escribe sobre tres clases de personas en el ámbito de Big Data: 'aquellos que crean datos (tanto conscientemente como dejando huellas digitales), aquellos que tienen los medios para recopilarlos y aquellos que tienen experiencia para analizarlos’. Obviamente el último grupo es el más pequeño y el más privilegiado: también son los que determinan las reglas sobre cómo se utilizará el Big Data y quién participará. Si bien las desigualdades institucionales pueden ser una causa perdida, sin embargo, deben ser examinadas y cuestionadas ya que producen un sesgo en los datos y los tipos de investigación que generan.

Complementary link:

Big Data Tools and Technologies, simplilearn.com (2017)

En Este tutorial de corte didáctico se explica qué es el Big Data, los desafíos que derivan del mismo y algunas de las herramientas populares relacionadas con el procesamiento y la gestión del Big Data.
El principal desafío es almacenar y procesar los datos en un período de tiempo específico. El enfoque tradicional no es eficiente para hacer eso. Así que han surgido las tecnologías Hadoop y varias herramientas de para resolver los desafíos en el entorno. Hay una gran cantidad de herramientas de Big Data, todas ellas ayudan de una u otra manera a ahorrar tiempo, dinero y a cubrir las perspectivas de negocios.



Bibliografía
  • boyd, d., & Crawford, K. (2011). Six Provocations for Big Data. A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society. http://dx.doi.org/10.2139/ssrn.1926431
  • Wesch, M. (2007, March). The Machine is Us/ing Us (Final Version) [Video file]. Retrieved from https://youtu.be/NLlGopyXT_g
  • Common Craft (n.d.). Big data [Video file]. Retrieved from https://www.commoncraft.com/video/big-data
  • Alarcon, A., Zeide, E., Rosenblat, A., Wikelius, K., boyd, d., Peña, S. & Yu, C.   (2014). Data & Civil Rights: Education Primer. Data & Civil Rights Conference. http://dx.doi.org/10.2139/ssrn.2542268
  • El big data y el mito de una ciencia sin teoría. Autor: Mazzocchi Fulvio Embo Reports 16(10):1250-1255, Oct 2015. https://onlinelibrary.wiley.com/doi/full/10.15252/embr.201541001
  • Big Data, ¿solo datos? ¿Objetividad vs Subjetividad? Joels Hidalgo (2018)                                                         https://comunidad.iebschool.com/bigdatamarkfans/2018/05/05/big-data-objetividad-vs-subjetividad-2/
  • ‘Big data’ no es tan listo como se cree, Sergio C. Fanjul (2016)                                                                              https://elpais.com/elpais/2016/11/07/talento_digital/1478535225_341110.html
  • Big Data Problems: Crash Course Statistics                                                                                                              https://www.youtube.com/watch?v=Im3GkAYUivE
  • ¿Por qué me vigilan, si no soy nadie? TED Madrid. Marta Peirano (2015)                                 https://www.youtube.com/watch?v=NPE7i8wuupk
  • Big Data Tools and Technologies, simplilearn.com (2017)                                                                                       https://www.youtube.com/watch?v=Pyo4RWtxsQM