Academia.eduAcademia.edu

La supuesta opacidad de los datos

2024

Un experto valuador me argumentó recientemente que «la información sobre los precios de los inmuebles en Venezuela está deficitaria por la opacidad 1 en datos de ofertas y registros», al respecto le respondo que lo que señaló lo he escuchado reiteradamente por parte de valuadores venezolanos, con lo cual no puedo estar de acuerdo. También he escuchado y leído que algunos utilizan el «método de Chauvenet» 2 asegurando que es la base de sus avalúos, con lo cual tampoco estoy de acuerdo, porque es solo una prueba para identificar datos atípicos, el método es el Comparativo de Datos de Mercado3 . Hace mucho ruido escuchar sobre la opacidad de los datos, que pudiera ser una verdad del tamaño de una catedral, pero se debe demostrar con números y no solo basarse en una apreciación personal, en una vivencia, en una visión en el momento. Para llegar a una opinión insesgada4 , hay que investigar, pero no todo el mundo está dispuesto a ocupar su tiempo ni está preparado para ello.

1 La supuesta opacidad de los datos Un experto valuador me argumentó recientemente que «la información sobre los precios de los inmuebles en Venezuela está deficitaria por la opacidad1 en datos de ofertas y registros», al respecto le respondo que lo que señaló lo he escuchado reiteradamente por parte de valuadores venezolanos, con lo cual no puedo estar de acuerdo. También he escuchado y leído que algunos utilizan el «método de Chauvenet»2 asegurando que es la base de sus avalúos, con lo cual tampoco estoy de acuerdo, porque es solo una prueba para identificar datos atípicos, el método es el Comparativo de Datos de Mercado3. Hace mucho ruido escuchar sobre la opacidad de los datos, que pudiera ser una verdad del tamaño de una catedral, pero se debe demostrar con números y no solo basarse en una apreciación personal, en una vivencia, en una visión en el momento. Para llegar a una opinión insesgada4, hay que investigar, pero no todo el mundo está dispuesto a ocupar su tiempo ni está preparado para ello. Hay alumnos que me han escrito sobre la posición de algunos profesores que les dicen lo mismo, sobre la naturaleza de los datos, por ello le enseñan a utilizar métodos de análisis muy fáciles en el papel, por la forma como lo enseñan por repetición, pero no en profundidad como esos procedimientos merecen, por ejemplo: AHP, estimadores robustos, análisis gaussiano, etc.5 1 La opacidad en la información se refiere a la falta de transparencia o claridad en los datos, procesos o decisiones. 2 El método Chauvenet fue desarrollado por el matemático y astrónomo estadounidense William Chauvenet en el siglo XIX. 3 El Método Comparativo de datos de mercado es una técnica utilizada en la valoración de bienes, propiedades o activos. Consiste en analizar los precios o valores de bienes similares que se han vendido recientemente en el mercado para determinar el valor de un bien específico. 4 Una opinión imparcial o insesgada es aquella que se forma sin influencias externas que puedan distorsionar el juicio o la perspectiva del individuo que la emite 5 Ver los detalles en el libro «el Fabuloso Avalúo de un Castillo Medieval» Miguel Camacaro Ediciones 6 La economía venezolana está experimentando una grave crisis caracterizada por una hiperinflación descontrolada, escasez de bienes básicos, una profunda recesión económica, devaluación de la moneda y una creciente crisis humanitaria Lo impactante es que los valuadores, en general, compran las ideas sin cuestionar nada, sobre todo las ideas con soluciones expeditas sin profundizar en el por qué son «las más fáciles y útiles», sin cumplir con las exigencias de las normas para avanzar más rápidamente en la entrega de sus trabajos. En estos momentos difíciles de la economía del país6, aún existe evidencia sobre el uso de la fuente de información de donde provienen los tipos de datos (precios de inmuebles): los de la Oficina del Registro Público y las ofertas de páginas web7, como se señaló anteriormente. Hay preferencia entre los valuadores del uso de las ofertas inmobiliarias8. Están publicadas y contienen mucha información sobre el inmueble, no todas las necesarias para una completa identificación de las variables responsables de la formación de los precios, de manera que corresponde al valuador o al encargado de hacerlo, levantar la muestra de mercado para su validación. Allí es donde hay una gran debilidad en la estructuración de bases de datos 9 que no se enseña en los cursos básicos de valuadores. Se enfocan en enseñar las metodologías, pero no explican cómo hacer las bases de datos y de las técnicas para analizarlos. Eso de hacer un “avaluito”10 con cuatro datos y aplicar una estadística descriptiva sin conocimiento en el 7 Según la consulta realizada, CHAT GPT señala: hasta mi última actualización, existen sitios web populares en Venezuela para publicar ofertas de inmuebles, entre otros está MercadoLibre Venezuela, que es una plataforma en línea muy conocida que ofrece una sección dedicada a la venta y alquiler de propiedades. 8 La Norma NBR 14653-2 es una norma técnica utilizada en Brasil, que establece los procedimientos y criterios para la realización para la valuación de bienes inmuebles y especifica que se deben considerar las ofertas de venta y alquiler de propiedades similares en el mercado como uno de los enfoques para determinar el valor de un inmueble. 9 Estructurar bases de datos significa organizar y diseñar de manera sistemática la información que se almacenará en una base de datos. 10 El término "avaluito" no es común en español. Es posible que haya sido un error tipográfico o una combinación de palabras. Si te refieres a "avalúo", este es el proceso de determinar el valor de un bien inmueble, como una casa, un terreno, un edificio, etc. 2 tratamiento de la muestra es contrario a la ciencia11. Si alguna vez lo hicimos era porque así nos los enseñaron. Que lejos estábamos de la correcta solución. No todos han evolucionado para estar a la par del desarrollo de nuevos conocimientos. Algunos insisten en el uso de ese proceso de valuación, pero lo más grave es que también lo transmiten a la generación de relevo. Hoy con la Ciencia de Datos12 y la Inteligencia Artificial13 se cuentan con herramientas para analizar muestras del mercado, pero el valuador debe ponerse como meta hacer su propia base de datos, en el mejor de los casos del tipo colaborativa14. Lo contrario es seguir repitiendo los mismos errores, y si a eso se suma la ausencia de normas nacionales de valuación15, entonces, la anarquía estará presente siempre en el ejercicio de la profesión del valuador. Antes era un hecho notorio y público que empresas y algunos valuadores16 vendían los datos (hoy igualmente lo hacen), pero con ciertos registros de bases de datos que contenían ciertos campos, pero no eran suficiente para explicar la variación de precios mediante modelos econométricos17. 11 La ciencia es un proceso sistemático de adquisición de conocimientos sobre el mundo natural a través de la observación, la experimentación y la formulación de teorías y leyes que explican los fenómenos observados. 12 La ciencia de datos es un campo interdisciplinario que se enfoca en el análisis y la interpretación de datos. Emplea el método científico para extraer conocimiento y comprensión sobre fenómenos del mundo real. 13 La Inteligencia Artificial (IA) es un campo de la informática que se centra en el desarrollo de sistemas y máquinas capaces de realizar tareas que normalmente requieren inteligencia humana. Estas tareas incluyen el aprendizaje, el razonamiento, la percepción, la comprensión del lenguaje natural, la resolución de problemas y la toma de decisiones. 14 Las bases de datos colaborativas son sistemas de gestión de información diseñados para permitir que múltiples usuarios contribuyan, accedan y modifiquen datos de manera colaborativa. 15 En Venezuela, existen normas técnicas y regulaciones que rigen los procesos de valuación de bienes raíces. Sin embargo, hasta donde alcanza mi conocimiento, no existe una norma específica conocida como "Normas Nacionales de Valuación" en el país. 16 Se debe señalar el importante rol del Ing. José Néstor García López, un pionero de la valuación en Venezuela, quién era el proveedor de información de referenciales obtenidos de la Oficina de Registro Público en Barquisimeto. 17 Un modelo econométrico es una herramienta analítica que utiliza principios de la teoría económica y métodos estadísticos para analizar y predecir relaciones entre variables económicas Para tener una «colección de datos» hay que saber que expresa la teoría de muestreo18, como el procedimiento para accesar a las fuentes de información. Es importante identificar las variables 19 : su clasificación, descripción, que representan, que miden, cuáles son sus unidades de medición, su nomenclatura, en fin, este procedimiento básico debe ser una estrategia fundamentada en la ciencia para lograr el objetivo de estructurar una confiable base de datos. Esto hay que hacerlo de forma continua, no vale hacerla para la oportunidad que hay que hacer un trabajo de valuación. Es importante conocer la historia de los datos20, para saber que sucede con la información en el presente, y porque no en el futuro, la tarea es extraer la información para analizar temporalmente los datos. La referencia espacial 21 de los datos también es un aspecto muy importante, pero es un factor común que no se analiza en los informes de los «valuadores atomizados22», lo cual genera resultados sesgados23, ya que no considera la incidencia de la macro y micro localización de los inmuebles comparables. Pero aún en los Modelos de Valuación Automatizados24, pueden ocurrir sesgos en las predicciones de valor si no 18 La teoría del muestreo es un conjunto de principios y técnicas utilizadas para seleccionar una muestra representativa de una población más grande con el fin de realizar inferencias sobre dicha población 19 En el contexto de la investigación y el análisis de datos, una variable es una característica, atributo o medida que puede tener diferentes valores y que puede ser objeto de observación, medición o manipulación. 20 Los datos antiguos son importantes en la investigación porque proporcionan información histórica y permiten rastrear tendencias, cambios y evoluciones a lo largo del tiempo. 21 La espacialidad en los precios inmobiliarios es un factor crucial debido a que el valor de una propiedad está estrechamente relacionado con su ubicación geográfica y las características del entorno. 22 Los valuadores atomizados se pueden describir como evaluadores individuales o pequeñas empresas de valuación que operan de manera independiente o autónoma. 23 En estadística, resultados sesgados se refieren a estimaciones o conclusiones que están influenciadas por algún tipo de sesgo sistemático o parcialidad en el proceso de recopilación, análisis o interpretación de los datos 24 Los modelos de valuación automatizados son sistemas o algoritmos que utilizan datos y técnicas de análisis automatizado para estimar el valor de un activo o propiedad, como bienes raíces, acciones, bonos, empresas, entre otros 3 están presentes todas las variables importantes, que a veces se omiten por el uso de bases de datos homogéneas. Hoy veo reportes de cámaras inmobiliarias venezolanas donde manejan una gran base de datos y solo utilizan una medida de tendencia central, sin el aparente saneamiento de la muestra, tampoco realizan la homogeneización25, y por ello, esos resultados presentan un verdadero sesgo. Pero el consumidor de esa información lo asume como válida porque supuestamente hay un estudio estadístico complejo detrás de esos números, nada más alejado de la realidad. Otros señalan que «eso es lo que hay, agarrando, aunque sea fallo», como se diría coloquialmente. Actualmente hay personas que están promoviendo la venta de información de comparables de ofertas y de registros en Venezuela, pero con limitaciones por el desconocimiento de herramientas y métodos para el tratamientos de datos. Para optimizar ese servicio, el «valuador atomizado» debe recibir una preparación integral que incluya en sus programas de estudios, disciplinas de la ciencia de datos. También las instituciones o clientes contratantes deben elevar las exigencias en la entrega de los informes de valuación, resaltando el cumpliendo de las normas técnicas. Considero que hay muchas oportunidades para prepararse on line por la diversidad de cursos que se ofrecen en forma gratuita en diferentes plataformas 28 . Para los valuadores están dadas las condiciones para incorporarse en el análisis de la información proveniente de las bases de datos del mercado inmobiliario, teniendo como reto integrar la Ciencia de la Valuación 29 con la Ciencia de Datos. Como colofón, quiero dejar constancia que la gran mayoría de las citas en los pies de páginas de este artículo son respuestas de CHAT GPT30 con el uso del Prompt Engineering31. Los valuadores siempre hemos vendido información. De hecho, los valuadores hacemos desde siempre un informe de valuación que contiene datos que las personas o empresas necesitan para sus negocios, y que pagan por ese servicio de información. En el fondo hemos ejercido la labor profesional de un trabajador de datos26, y en el mejor de los casos, somos Analistas de Datos27. Miguel Alberto Camacaro Pérez, DSLE @mundovalor 25 método científico. Este campo combina principios de economía, finanzas, estadística, matemáticas y otras disciplinas para evaluar el valor de diversos activos, como bienes raíces, empresas, inversiones financieras, obras de arte, entre otros. La ciencia de la valuación busca comprender y aplicar los factores que afectan el valor de un activo, así como desarrollar métodos y modelos para estimar dicho valor de manera precisa y confiable. 30 ChatGPT es una abreviatura de "Chat Generative Pre-trained Transformer". Es un tipo de modelo de lenguaje desarrollado por OpenAI, específicamente en la arquitectura GPT (Generative Pre-trained Transformer). ChatGPT es capaz de generar respuestas y conversaciones en lenguaje natural basadas en el contexto proporcionado en forma de texto. 31 La Ingeniería de Preguntas (Prompt Engineering) refiere a una técnica utilizada en inteligencia artificial (IA) para optimizar y ajustar modelos de lenguaje para tareas particulares y resultados deseados. También se la conoce como diseño de avisos o alertas (Prompts), que construye cuidadosamente indicaciones o entradas para modelos de IA con el fin de mejorar su desempeño de tareas específicas. La homogeneización de una muestra de mercado inmobiliario es un proceso en el que se ajustan o normalizan los precios de las propiedades para hacerlas comparables entre sí. 26 Un trabajador de datos en el campo de la ciencia de datos es un profesional que se encarga de recopilar, limpiar, procesar, analizar y visualizar datos con el objetivo de obtener información significativa que pueda utilizarse para la toma de decisiones o para resolver problemas en diversos ámbitos 27 Un analista de datos en el campo de la ciencia de datos es un profesional especializado en la interpretación y análisis de conjuntos de datos para extraer información significativa y tomar decisiones informadas. 28 LinkedIn Learning es una plataforma de aprendizaje en línea que ofrece una amplia variedad de cursos y tutoriales sobre temas relacionados con el desarrollo profesional, la tecnología, el liderazgo, la creatividad, el diseño, la programación y muchas otras áreas. 29 La ciencia de la valuación es un campo interdisciplinario que se enfoca en determinar el valor de los activos, bienes o propiedades utilizando el