Variant data, datos de la variante. Francisco Javier Cervigon Ruckauer

Variant data, datos de la variante

  • Avoid confirmation bias when conducting searches.
  • Evitar el sesgo de confirmación cuando la realización de búsquedas.

Versión en texto

Lesson 5.2: Variant data
Contents:
  1. Facts may vary based on definitions
  2. Verify the source of a piece of information, using the precise information you have
  3. Confirm a fact, using a generic description for what you seek
As we were discussing in the last lesson, one of the challenges about doing web searches is that there is so much data out there.
One of the problems with so much data out there is that you will often get variant data; that is, different versions of the same piece of information.
Even a simple fact might have some more subtlety involved in it.
For example, compare the results for the [circumference of the earth].
Figure: Search results for the query [circumference of the earth].
One question to ask yourself before you search is: Does this fact vary based on some contextual information?
Perhaps you know that the circumference of the earth varies depending on whether you measure around the equator or around the poles. If you are not aware of that, you might believe that the earth is a perfect sphere and that a single number is a perfect description of its circumference. In reality, it’s very close to a perfect sphere, but there is variation.
Since Google search is so fast, it is easy to explore variations of ideas and understand whether or not your result is a fact that actually describes the circumstances of the context that you are trying to understand.
1. To verify the source of a piece of information, use the precise information you have.
One piece of advice that's given to every investigative reporter, that every detective follows, and that every searcher should follow, is to identify the sources of information. If you read something like, "63 percent of all kids looked at pictures of funny cats today," one of the first things you should be asking yourself is, “Where did that come from?”
To track a particular fact back to its source, try pulling out terms that you can be fairly sure will appear in any page that talks about your particular fact. In this case, terms like63, kids, pictures, funny, and cats might all be useful. Try searching:
Figure: Search results for the query [63 percent kids pictures funny cats].
What you may notice here is there is no sign of the statistic you seek. You could play around some more, but would continue to be unable to find an original source--because this is not a real statistic. The fact that nothing comes up with this search starts to suggest that something is amiss.
Compare the above search with this scenario: you hear that it is estimated that the British were projected to win 62 medals in this summer’s Olympic games. You want to find out where that statistic originated, so you try a search like:
Figure: Search results for the query [62 british medals olympics].
In these results, you can see that there is, indeed, a study making such a claim. You could click on these links and find out who wrote the study, and either follow links or run one more search to pull up the study itself.
This process says nothing about the quality of the information in the study, but it does allow you to identify the precise source of your original statistic.
Whenever you ask a question like this, you want to understand: Where did that number come from? How was it measured? What are the other factors that go into making that assertion true or not true? Then, you start considering: credible or not credible?
2. To confirm a fact, use a generic description for what you seek.
While identifying a source often includes searching for a particular number, name or other precise source of information, if you want to confirm that a fact is true, you need to take a different approach. Searching for [president alexander hamilton] may bring back documents which mistakenly identify the historical figure Alexander Hamilton as a former president of the United States, whereas searching for [alexander hamilton biography] or just [alexander hamilton] would allow you to find and read documents that would make it clear he never acted as President.
In another example, take a query like [the average length of an octopus is 18 inches].
Figure: Search results for the query [the average length of an octopus is 18 inches].
With a query like this, you get some very nice looking results. But then, if you look in the snippet, it says “13 to 18 inches in diameter” and “18 inches across.” People will scan these initial results, find the thing that they were asking about, in this case 18 inches, and think that their hypothesis is confirmed.
Don't be misled. The snippet is an extraction of the underlying web page.
If your query contains the answer you think you are looking for—that is, you're looking for confirmation—you fall suspect to what we call the confirmation bias: you're only looking for things you already believe to be true.
In fact what you should be doing is a query more like [average length octopus].
Figure: Search results for the query [average length octopus].
This gives you a wider range of results that you can then compare to your initial assumption.
So, keep in mind is that there are different ways you can phrase your query, depending on your desired outcome. You can look for confirmation of information you already know, or you can try to find the range of variation of things that are out there. What you should do as a good searcher is to try to gather a variety of information and then use your skills to synthesize, filter, and organize that information to get to the bottom of it.
Try to do that in the next activity.

Versión en texto

Lección 5.2: datos Variant
Contenido:
  1. Los hechos pueden variar en función de las definiciones
  2. Verificar el origen de una pieza de información, utilizando la información precisa que tiene
  3. Confirmar un hecho, el uso de una descripción genérica de lo que buscan
Como estábamos discutiendo en la lección anterior, uno de los retos sobre cómo hacer búsquedas en la web es que hay tal cantidad de datos que hay.
Uno de los problemas con tal cantidad de datos que hay es que a menudo obtendrá los datos de la variante  es decir, diferentes versiones de la misma pieza de información.
Incluso un simple hecho podría tener un poco más de sutileza que participan en ella.
Por ejemplo, comparar los resultados para el [ circunferencia de la tierra ] .
Figura: resultados de búsqueda para la consulta [ circunferencia de la tierra ].
Una pregunta que debe hacerse antes de buscar es: ¿Varía este hecho sobre la base de cierta información contextual?
Tal vez usted sabe que la circunferencia de la tierra varía en función de si se mide alrededor del ecuador o alrededor de los polos. Si usted no es consciente de ello, es posible que cree que la tierra es una esfera perfecta y que un solo número es una descripción perfecta de su circunferencia. En realidad, es muy cerca de una esfera perfecta, pero hay variación.
Desde la búsqueda de Google es tan rápido, es fácil de explorar las variaciones de las ideas y entender si su resultado es un hecho que en realidad describe las circunstancias del contexto en el que usted está tratando de entender.
1. Para verificar el origen de una pieza de información, utilice la información precisa que tiene.
Una pieza de consejo que se le da a cada periodista de investigación, que cada detective sigue, y que cada investigador debe seguir, es identificar las fuentes de información. Si se lee algo así como, "un 63 por ciento de todos los niños parecía a las fotos de gatos divertidos hoy", una de las primeras cosas que debe estar preguntando es: "¿De dónde vienen?"
Para el seguimiento de un hecho particular de nuevo a su fuente, trate de sacar términos que usted puede estar bastante seguro de que va a aparecer en cualquier página que habla sobre el hecho particular. En este caso, términos como 63, niños, fotos, divertido, y los gatos  podrían resultar útiles. Prueba a buscar:
Figura: resultados de búsqueda para la consulta [ 63 por ciento de los niños Fotografías gatos divertidos ].
Lo que se puede observar aquí es que no hay signo de la estadística que está buscando. Se podría jugar un poco más, pero seguiría siendo incapaz de encontrar una fuente original - porque esto no es una estadística real. El hecho de que no aparece nada con esta búsqueda comienza a sugerir que algo anda mal.
Comparación de la búsqueda anterior con este escenario: se oye que se estima que los británicos se proyectaron para ganar 62 medallas en los juegos Olímpicos de este verano. ¿Quieres saber donde se originó esa estadística, por lo que se intenta una búsqueda como:
Figura: resultados de búsqueda para la consulta [ 62 medallas británicas olimpiadas ].
En estos resultados, se puede ver que hay, de hecho, un estudio hacer esa afirmación.Puede hacer clic en estos enlaces y averiguar quién escribió el estudio, y, o bien seguir los vínculos o ejecutar una búsqueda más para levantar el propio estudio.
Este proceso no dice nada sobre la calidad de la información en el estudio, pero permite identificar la fuente exacta de la estadística inicial.
Cada vez que se hace una pregunta de este tipo, se quiere entender: ¿De dónde vino ese número viene? ¿Cómo se mide? ¿Cuáles son los otros factores que van a hacer que la afirmación verdadera o no es verdad? A continuación, empezar a considerar: creíble o no es creíble?
2. Para confirmar un hecho, utilice una descripción genérica de lo que buscan.
Mientras que la identificación de una fuente a menudo incluye la búsqueda de un número, el nombre específico o alguna otra fuente precisa de la información, si desea confirmar que un hecho es cierto, es necesario adoptar un enfoque diferente. La búsqueda de [el presidente Alexander Hamilton] puede traer de vuelta los documentos que identifican erróneamente la figura histórica Alexander Hamilton como ex presidente de los Estados Unidos, mientras que la búsqueda de [biografía Alexander Hamilton] o simplemente [Alexander Hamilton] le permitirá encontrar y leer documentos eso sería dejar claro que nunca actuó como presidente.
En otro ejemplo, tomar una consulta como  [ la duración media de un pulpo es de 18 pulgadas ].
Figura: resultados de búsqueda para la consulta [ la duración media de un pulpo es de 18 pulgadas ].
Con una consulta de este tipo, se obtienen algunos  muy buenos resultados que buscan. Pero entonces, si nos fijamos en el fragmento, que dice "13 a 18 pulgadas de diámetro" y "18 pulgadas de ancho." La gente va a analizar estos resultados iniciales, encontrar lo que estaban preguntando por, en este caso de 18 pulgadas , y piensa que su hipótesis se confirma.
No se deje engañar. El fragmento es una extracción de la página web subyacente.
Si la consulta contiene la respuesta que considere que está buscando, es decir, que está buscando la confirmación, se cae sospechoso a lo que llamamos el sesgo de confirmación  sólo estás buscando cosas que ya creen que es verdad.
De hecho, lo que debe hacer es una consulta más como [ pulpo longitud promedio] .
Figura: resultados de búsqueda para la consulta [ longitud media de pulpo] .
Esto le da una gama más amplia de resultados que a continuación se puede comparar a la hipótesis inicial.
Por lo tanto, tener en cuenta es que hay diferentes maneras en que puede plantear la consulta, dependiendo de su resultado deseado. Usted puede buscar la confirmación de lo que ya sabe, o puede tratar de encontrar el rango de variación de las cosas que están ahí fuera. Lo que debe hacer como un buen buscador es tratar de reunir una variedad de información y luego utilizar sus habilidades para sintetizar, filtrar y organizar esa información para llegar al fondo del mismo.
Trate de hacer eso en la siguiente actividad.
Francisco Javier Cervigon Ruckauer

No hay comentarios:

Publicar un comentario