Saturday, August 26, 2006

Mi artículo en Proceso...

He aquí mi artículo, que se publicó este viernes pasado en la página de dicha revista:


La ciencia y el proceso electoral
Manuel López Michelone



La elección federal del 2 de julio es sin duda uno de esos acontecimientos que debemos considerar seriamente. En muchos años no había habido una elección para presidente de la república que fuese tan, pero tan competida. Durante los meses anteriores a dicho proceso, las encuestas dieron puntos porcentuales a favor de uno u otro candidato (PAN y PRD). El PRI, por su parte, simplemente no pintó y su institucional candidato finalizó tercero sin pena ni gloria.

Al terminar las elecciones, para muchos fue evidente que el conteo que hizo el PREP parecía amañado, particularmente por el candidato que iba perdiendo (López Obrador). A las 24 horas de dicho conteo, se halló que Felipe Calderón tenía una ventaja de 0.5 puntos porcentuales sobre su acérrimo rival. Así, aparentemente el candidato panista habría ganado la elección. Desde luego que el PREP no da el conteo final, así que no se podía anticipar aún nada. En los días siguientes, el conteo completo insistió en que Calderón mantenía su medio punto porcentual e incluso el IFE, ilegalmente, daba ganador de facto al candidato del PAN. López Obrador entonces empezó una campaña para que se recontara toda la elección: voto por voto y casilla por casilla, fue y sigue siendo supuestamente el lema que ampara todo el movimiento. El PRD impugnó alrededor de 70,000 casillas, pero el TRIFE sólo consideró que aproximadamente 11,000 requerían ser recontadas. Aparentemente no cambió significativamente el conteo y AMLO insiste en que deben abrirse y recontarse todas las casillas, porque sino, de acuerdo a su cavilar, el país tendría un presidente sin credibilidad, espúreo.

Con el paso de los días se ve que la insistencia del voto por voto ni siquiera la tomará en cuenta el TRIFE y es probable que Calderón sea el candidato al que se le dé el triunfo. AMLO no ceja en su empeño de indicar que hubo fraude, primero –dijo– cibernético, aunque después corrigió y dijo que fue “a la antigüita”. El candidato perredista descalificó a funcionarios de casilla e incluso, a sus propios representantes en las mismas. Sugirió que algunos de ellos se habrían vendido. Es más, presentó un video con el “embarazo” de una urna, aunque más tarde se aclaró que no existió tal. El funcionario que estaba metiendo los votos en la urna lo hizo porque los votantes se equivocaron de urna cuando emitieron su voto y además, dicho proceso se hizo bajo la vigilancia de los representantes de los partidos políticos en esa casilla.

Así, entre errores del partido reclamante, sugerencias de fraude electoral y de incluso, una elección de estado, AMLO con el PRD mantienen un megaplantón en Reforma y en mi personal opinión, el conflicto tiende a escalarse peligrosamente. A ver qué pasa. En el mientras, me di a la tarea de investigar más acerca de la elección, y encontré un estupendo estudio del Dr. Miguel de Icaza-Herrera, de Centro de Física Aplicada y Tecnología Avanzada, de la UNAM, situado en Querétaro, en donde hace un análisis muy interesante, sobre la elección del 2 de julio. El estudio de 16 páginas puede hallarse en http://www.fata.unam.mx/icaza/ffrau2.pdf y se titula: “Fraude Acromático en las elecciones del 2 de julio de 2006”. El autor le llama “acromático” a su trabajo, porque no tiene relación con ninguno de los cinco candidatos. Lo que hace es analizar los datos del IFE y encuentra inconsistencias por demás notables. Algunos resultados presentados en la elección resultan, en opinión del doctor en física, imposibles. Lo que me parece muy importante en todo caso es que el rigor de la ciencia se ve claramente en este trabajo e incluso, el mismo Dr. De Icaza, en las conclusiones de su estudio, analiza los puntos débiles de su propio trabajo.

¿Cuáles son esos resultados que De Icaza considera imposible? El análisis habla de la participación de votantes en multitud de casillas. Si votó el 58.5 % de los ciudadanos, a nivel estadístico, se puede saber fácilmente la participación ciudadana por casilla. Fíjense en este dato notable: Si se grafica el porcentaje de participación en las 130000 casillas, muchos resultados corresponden al valor cercano a 50%. Sin embargo, se encontró que el porcentaje de participación tomó en muchos casos valores superiores al 100%. Esto simplemente significa, como anota De Icaza, que hay más votos que boletas en la lista nominal. Hay incluso casillas que rebasan la línea del 100%. ¡Existe una casilla que rebasa el 250% de participación!

Ahora bien, estadísticamente el investigador de la UNAM encuentra que es imposible que en una casilla con más de 27 nombres en su lista nominal, todos, absolutamente todos, se presenten a votar. Si ya es imposible que todos voten, es incluso más improbable (me parece que se evidencia un tono de sarcasmo de parte de De Icaza), que vote un número mayor al de la lista nominal. Se encuentra con los propios datos del FE, que esto sucedió muchas veces el 2 de julio. Para ejemplificar el problema, al Dr. De Icaza se le ocurre una simpática analogía: Hay un poco más de 71 millones de nombres en el padrón electoral. Se contaron casi 42 millones de votantes. Imaginemos una bolsa con canicas blancas y negras, que representan aquellos que votaron y los que no lo hicieron, respectivamente. Así, en esa bolsa hay 41791322 canicas blancas y el resto de color negro. Si las canicas son del mismo peso y consistencia, y si empezamos a sacar canicas al azar, ¿cuál es la probabilidad de que se saquen 750 canicas blancas? Es decir, el total de votantes de una casilla. De acuerdo al físico De Icaza, el valor es 0.59 a la potencia 750. Este número es muy pequeñito.

Para hacer el asunto más realista, consideremos que si la lista nominal tiene 27 nombres, la probabilidad de que voten los 27 ya es inferior a un diez millonésimo. Sin embargo, el estudio demuestra que esto ocurrió muchas veces. Dice entonces De Icaza: ¿es alguna mano divina? ¿Son errores cometidos por los funcionarios entrenados por el IFE?

La lectura del trabajo de De Icaza es fascinante. El investigador presenta argumentos, apela a teoremas matemáticos y a los de la estadística, para probar que francamente muchos datos que el IFE ha entregado contienen inconsistencias matemáticamente imposibles de explicar. La idea de fraude electoral tiene más sentido viniendo de un estudio serio, medido, con el rigor de quien se dedica a la ciencia que simplemente indicando que el fraude se hizo a la antigüita o bien, mediante un algoritmo cibernético. La realidad es que el IFE está en un serio predicamento. No parece poder demostrar la transparencia que tanto pregona en sus anuncios en los medios. Y esto es lamentable, porque una de lasa instituciones que debiesen ser más transparentes es precisamente ésta. Pero no diré más. Ahí están los datos, ahí están los análisis serios de De Icaza. Saque usted sus propias conclusiones.

3 comments:

Yixus said...

Bueno, aún no leo el artículo de De Icaza, pero la analogía de las canicas presentada así me parece malísima: la probabilidad de sacar las 750 canicas blancas correspondientes a una casilla se calcula así sólo si sacas exactamente 750 canicas, pero como es claro, en la elección "se sacaron" el 59% de todas esas canicas. De hecho, se sacaron TODAS las blancas, por eso pienso que está mal planteado.

Luis_710211 said...

El siguiente texto corresponde a una tarea que realice hace dos años para la materia de Investigación cintífica, acerca del artículo del Dr. de Icaza, que es una crítica a dicho artículo, por el poco rigor científico con el que fue elaborado y los graves errores que presenta en sus supuestos, el texto es el siguiente:

INTRODUCCIÓN

El conocimiento, para que pueda considerarse científico debe ser objetivo, racional, sistemático, general, falible y metódico, además debe tener como características el desinterés y el espíritu crítico. Un trabajo o una investigación científica debe seguir un método, debe experimentar, aportar certezas en busca de la verdad y aportar evidencias que soporten las conclusiones, en resumen debe hacerse con espíritu científico. El objetivo de esta actividad es tratar de analizar con espíritu científico crítico un trabajo o caso científico y digo tratar, porque apenas estamos en el proceso de adquirir dicho espíritu, lo cual no es una tarea sencilla. Para hacer esta actividad seleccione un trabajo que intenta aportar evidencias de que en las pasadas elecciones presidenciales en nuestro país hubo un fraude.

Después de las pasadas elecciones presidenciales se han presentado multitud de estudios a los que consideran en diversos medios de comunicación y distintos blogs en Internet, e incluso en espacios cibernéticos de algunas universidades como: investigaciones científicas acerca de los resultados electorales del pasado 2 de julio. Estos trabajos pretenden probar ¿científicamente? Que hubo un fraude en las elecciones. De entre todos estos trabajos seleccioné uno por su claridad en la exposición del tema y por que incluye los datos suficientes para replicar sus análisis y porque aparentemente es un trabajo serio. Este trabajo está realizado por un catedrático e investigador del Centro de Física Aplicada y Tecnología avanzada de la UNAM: el Dr. M. de Icaza-Herrera Este trabajo lo tomé de la siguiente dirección electrónica: http://www.fata.unam.mx/icaza/ffrau2.pdf (consultado el 27 de septiembre del 2006)

Quizás el trabajo seleccionado no corresponda precisamente con un caso científico que tenga que ver con las tecnologías, tal y como se pedía para esta actividad, aunque indirectamente tiene que ver, ya que se considera que en las elecciones hubo un fraude cibernético, o sea que mediante los sistemas de computo se modificaron las


HECHOS

El 11 de agosto del 2006, el Dr. M. de Icaza-Herrera presentó un artículo titulado “Fraude Acromático en las elecciones del 2 de julio de 2006” con el objetivo de mostrar científicamente que algunos de los resultados de las elecciones presidenciales del pasado 2 de julio son imposibles. En este trabajo Icaza-Herrera nos explica como procesó la información que utilizó para llegar a las conclusiones que presenta, incluso describe los archivos utilizados, incluye el código fuente de los programas de cómputo que utilizó y algunos de los resultados de las consultas a la base de datos realizadas, además menciona que la base de datos que utilizó contenía 130789 registros, incluyendo el encabezado.

El trabajo consta de tres puntos, en el primero “Introducción” además de explicar lo mencionado en el párrafo anterior muestra que en las elecciones hubo 117 casos de casillas en las que el número de votos reportados en los resultados publicados por el IFE son mayores al número de electores registrados en la lista nominal.

En el segundo punto del artículo: “Es imposible una participación del 100% (o mayor), afirma que es imposible que el 100% de los electores de una casilla con una lista nominal de 27 personas o más, asistan a votar y menciona que hay algunas casillas en las que así ocurrió, de acuerdo con los resultados publicados, el hecho de que sea imposible lo sustenta bajo el supuesto de que la probabilidad de que el 100% de los electores de una casilla acuda a votar esta dado por p = 0.59n, en donde n = numero de electores registrados en la lista nominal de la casilla. El 0.59 corresponde a la probabilidad de que un elector asista a votar, ya que en las elecciones del 2 de julio pasado votó el 59% de los electores, entonces a nivel nacional la probabilidad de que un elector haya asistido a votar es de 0.59, entonces la probabilidad de que en una casilla en la que hay 750 electores registrados en la lista nominal asistieran todos a votar sería p = 0.59750 = 1.3772 * 10-172 , el cual es un número tan pequeño que siendo esta la probabilidad es imposible que ocurra.

Para explicar los resultados anteriores, hace la analogía de este caso con el hecho de que tuviéramos una gran bolsa de canicas de dos colores blancas y negras, en donde las blancas corresponderían a los electores que fueron a votar y las negras a las que no fueron, entonces la bolsa tendría en total 71,374,373 canicas que corresponde al total de ciudadanos que hay en la lista nominal. En total habría 41,791,322 canicas blancas (59%), que corresponde con el número de personas que votaron, según los resultados publicados por el IFE y las canicas negras serían el resto, que corresponde al 41%, de esta manera afirma que la probabilidad de sacar una bola blanca sería 0.59 y una blanca 0.41, entonces si se extrajeran dos canicas al azar la probabilidad de que las dos fueran blancas seria 0.59 * 0.59 = 0.592 y entonces si sacáramos un numero n de canicas, la probabilidad de que todas fueran blancas sería: 0.59n.

Asimismo en el punto dos afirma que la probabilidad de que en una casilla nadie vaya a votar es todavía menor que la de que todos vayan a votar, afirma que dicha probabilidad está dada por 0.41n y además presenta la lista los casos que encontró en los datos del IFE de casillas en las que no votó nadie, en total son 20 casos encontrados.

En el punto tres titulado: “Muchas casillas más con resultados imposibles” da respuesta a la pregunta: ¿a partir de cuantos electores de una casilla debemos considerar que es un evento imposible el hecho de que acudan a votar?, para lo cual fija como caso imposible a aquellos que estén por el orden de 1 en un millón o menos. Para cada casilla hace el cálculo siguiente:


En donde n = número de electores en la lista nominal y m = número de electores que tendrían que asistir a votar para que la probabilidad sea igual o menor a 1 en un millón. En total encontró que hubo 14,986 casillas en donde la probabilidad de que todos los que fueron a votar realmente hayan asistido es menor o igual a uno en un millón.

Por último en las conclusiones menciona que la interpretación propuesta tiene algunos puntos débiles, ya que se basa en los datos de participación aportados por el IFE y comenta que la cifra de total de personas en la lista nominal de electores es de 71 millones y que los resultados que publicó el INEGI de población de mayores de 18 años es de 63 millones y dice que si ambas cifras son correctas, debemos concluir que hay 8 millones de registros sin ciudadano, entonces la proporción de participación no sería 0.59 si no más bien 41/63=0.65, lo cual cambiaría mucho los resultados del análisis y supone que entonces la participación en cada casilla debería ser aún más baja.

Al final añade: “Si efectivamente se han añadido nombres al padrón del IFE, y estos corresponden a votantes que deben votar, entonces se produciría una situación con dos índices de participación ciudadana. Por un lado estaría la de los ciudadanos normales y por otro, el comportamiento de los ciudadanos añadidos. Esto permitiría efectivamente tener casillas con más altos niveles de participación, mismos que podrían llevar algunas casillas al nivel de participación del 100%. A lo anterior debemos a˜nadir el hecho de que muchos ciudadanos se presentaron a votar en su casilla pero no figuraban en la lista nominal, a pesar de que contaban con una credencial, es decir, el caso de los rasurados.


DUDA

Las dudas que surgen de de este trabajo son: ¿es imposible que hayan ido a votar el 100% de los electores o más en una casilla?, es imposible que hayan realmente votado los electores que el IFE reporta en aquellas casillas en donde la probabilidad de que hayan ido es: . ¿La evidencia mostrada en este trabajo es prueba de que hubo fraude en las elecciones presidenciales del 2006?, si bien no se no se afirma directamente que una relación entre que haya habido casos que estadísticamente son imposibles y el hecho de que haya habido un fraude, desde el título del trabajo así lo deja entrever y es la duda que el autor pretende infundir en los lectores del artículo.


ERROR

El primer error de este trabajo es: Afirmar que es imposible que el 100% de los votantes de una casilla hayan asistido, hay más elementos para suponer que en algunas casillas asistió el 100% de los votantes, los mismos hallazgos del trabajo de referencia muestran que hay casos en donde el porcentaje de votantes es igual o mayor al 100%, asimismo las actas correspondientes a las casillas son prueba de ello, además el razonamiento utilizado para llegar a esa conclusión es inexacto, ya que el planteamiento de que la probabilidad de que el 100% de los electores de una casilla asista a votar es de 0.592, es erróneo, porque esta basado en la probabilidad de eventos completamente aleatorios y el hecho de que una persona asista o no a votar no es aleatorio, nadie hecha un volado para decidir si va a ir a votar o no, depende de la voluntad de los electores.

Otro error es afirmar que es imposible que haya casillas en las que nadie fue a votar, ya que su misma investigación prueba que hubo 20 casos registrados, sin embargo de inicio en las elecciones del 2 de julio hubo 250 casillas que no abrieron y por lo tanto necesariamente tenían que tener una participación ciudadana = 0, aquí lo extraño es que son 250 e Icaza-Herrera solo detectó 20 casos.

Otro grave error es afirmar que hubo 14,986 casillas en las que los resultados publicados por el IFE muestran un numero de votantes en donde la probabilidad de que todos los que fueron a votar realmente hayan asistido es menor o igual a uno en un millón, ya que la evidencia mostrada al respecto también es errónea, porque también esta basada en probabilidades de eventos completamente aleatorios y como mencioné en el párrafo anterior la probabilidad de que alguien vaya a votar no es aleatoria, depende de la voluntad personal y si bien es raro que suceda es muy posible que suceda.

Obviamente es imposible que más del 100% de los electores se haya presentado a votar, pero no presenta ninguna evidencia de que se deba a algún fraude como lo hace suponer el autor.

Otro error es comparar la cifra de mayores de 18 años publicada por el INEGI y el total de personas inscritas en el padrón electoral, ya que son datos distintos, la población reportada por el INEGI, en primer lugar corresponde a octubre del 2005 y la de la lista nominal es la gente empadronada hasta julio del 2006, por otra parte en la lista nominal se encuentra toda la población mayor de 18 años que se empadronó entre 1990 y el 2006 y que ha emigrado a otro país, además es posible que no se hayan dado de baja algunos difuntos por errores o problemas en el registro de su defunción.

Otro error que además deja entrever falta de objetividad en este trabajo es el hecho de no explicar que de los 117 registros en los que el número de votantes es mayor al número de electores en la lista nominal, no en todos los casos favorece al partido ganador, de hecho hay casos en los que se favorece a la coalición encabezada por el PRD y en otros casos a la coalición encabezada por el PRI y por otra parte hay varios registros en los que lo que está mal es la suma de total de votantes sin embargo si se suman los votos nulos y los de todos los partidos, el total de votos es menor al total de ciudadanos de la lista nominal.

Hay otra inconsistencia que presenta el análisis


CONJETURA

En el trabajo analizado se hacen varias conjeturas principalmente las conclusiones, en donde todo lo que se menciona son conjeturas, el hecho de que según él existen 8 millones de registros en la lista nominal sin ciudadano y por lo tanto suponer que se hayan añadido nombres a la lista nominal y que por el hecho de que algunas personas que tienen credencial para votar y que no aparecieron en la lista nominal y de ahí suponer que se haya rasurado el padrón, son meras conjeturas ya que no aporta ninguna evidencia.


CERTEZA

El trabajo analizado no aporta ninguna certeza con respecto a su objetivo explicito que era mostrar que había muchos casos imposibles en los resultados electorales y mucho menos a su objetivo implícito que era mostrar que hubo fraude en las elecciones presidenciales del 2 de julio. La única certeza que podría desprenderse del artículo es que hay algunas casillas con resultados imposibles, los casos en que el número de población que acudió a votar registrados en los datos del IFE, es mayor que el número de votantes registrados en la lista nominal, sin embargo eso no aporta ninguna certeza de fraude electoral, ya que son pocos los casos y lo más probable de acuerdo con mi experiencia en trabajos en los que interviene tanta gente, puedo afirmar que es muy probable que se trate de errores humanos.


EVIDENCIA

La única evidencia valida presentada es que hay algunos casos de resultados imposibles en la realidad, que son aquellos en que el número de votantes es mayor al número de personas registradas en la lista nominal, sin embargo no es prueba de fraude electoral.


VERDAD

El trabajo analizado no llega a ninguna verdad.


CONCLUSIONES

No queda mucho por concluir acerca del trabajo analizado, salvo que es una pena que se utilice el nombre de la ciencia y de instituciones como la UNAM para difundir trabajos como el que aquí se analizó, ya que aunque si sigue un método, es racional (aunque con razonamientos erróneos) y tiene espíritu critico, no es objetivo, más bien es tendencioso, por lo cual no puede considerarse que aporta nada al conocimiento científico, no se desarrollo con espíritu científico. Por desgracia en mi búsqueda para seleccionar el trabajo a analizar en esta actividad me tope con un sinnúmero de artículos que en el nombre de la ciencia intentan convencer a base de evidencias erróneas de que hubo un fraude electoral el pasado 2 de julio, no tengo las evidencias para afirmar lo contrario, pero en muchos casos como en el trabajo analizado es fácil ver que las evidencias que presentan son erróneas.

Esta actividad me ha sido de gran utilidad para darme cuenta de la importancia que tiene el ser rigurosos en nuestras investigaciones y análisis cuando queremos hacer un trabajo científico y más importante aún es la objetividad. Sé que aún me falta mucho por desarrollar para llegar a tener espíritu científico, pero por lo pronto he visto varios ejemplos de lo que no debo hacer si quiero conseguirlo.

Morsa said...

Hola, Luis,

Leí con atención lo que has expuesto sobre el trabajo del Dr de Icaza. Debo decirte que, en mi opinión, algunos de tus puntos deben ser revisados. El Dr de Icaza es un experto en estadística y creo que ahí te rebasa. Tú dices: "el planteamiento de que la probabilidad de que el 100% de los electores de una casilla asista a votar es de 0.592, es erróneo, porque esta basado en la probabilidad de eventos completamente aleatorios y el hecho de que una persona asista o no a votar no es aleatorio, nadie hecha un volado para decidir si va a ir a votar o no, depende de la voluntad de los electores."

En estadística se habla de grandes números y por ello se pueden sacar conclusiones. La sociología usa la estadística contínuamente, y la utiliza para tratar de entender y modelar el comportamiento de grandes masas de seres humanos. Todos tenemos y tomamos nuestras propias decisiones, pero estadísticamente se puede saber qué le gusta, por ejemplo, comer más al mexicano. Tú argumento sería: "ahí la estadística falla porque todos comemos lo que queremos y eso lo decidimos". Así es, cada mexicano como lo que quiere, pero en la ciencia de los grandes números se pueden sacar conclusiones estadísticas valiosas.

La probabilidad de algún evento aparece precisamente al estudiar muchas instancias de lo mismo. Si alguien tira un volado y sale águila, no quiere decir que la siguiente vez saldrá sol. La tendencia sólo se ve con millones de volados, no tirando diez, veinte, mil, o diez mil.

Por ello, la tendencia en las casillas no es que vayan a votar todos. De hecho, la probabilidad que calcula de Icaza parece razonable y de nuevo, hablamos de masas de personas, del conjunto de electores que a todo esto es un número que oscila en los millones, por lo que la conclusión de De Icaza suena sensata, aunque desde luego, es una mera aproximación probabilística. Nadie puede saber con precisión absoluta esto, porque de nuevo, es la estadística, el fenómeno de los grandes números que se repiten.

Creo igualmente que es aventurado acusar a De Icaza de poco rigor científico. Al contrario, si algo lo caracteriza como científico es precisamente el rigor que le criticas. Vaya, es tan rigoristaq que su planteamiento expone qué hizo, cómo lo hizo, con qué herramientas lo hizo. En mi opinión ahí de plano fallas en tu juicio.

Sin embargo, con respecto a otros valores que das, puedo conceder que De Icaza pudiese estar equivocado. Algunas conjeturas pueden ser equivocadas y el modelo que plantea De Icaza no tiene que estar totalmente correcto y además, siempre está en tela de juicio. Es probable (fíjate cómo uso la palabra probable), que algunas de las conclusiones de De Icaza estén mal y las tuyas correctas.

Saludos
Manuel