Cualquiera que compre o venda una casa conoce Zillow. En 2006, la compañía introdujo Zillow Estimate, o Zestimate para abreviar, que utiliza una variedad de fuentes de datos y modelos para crear un valor aproximado de propiedades residenciales.
El impacto del Zestimate de Zillow en la industria inmobiliaria ha sido considerable, por decir lo menos.
Desde la perspectiva del comprador de vivienda, Zestimate de Zillow permite una transparencia significativa en torno a los precios y la información que históricamente solo estaba disponible para los corredores. La empresa ha democratizado genuinamente la información inmobiliaria y añade un valor tremendo a los consumidores.
Para los corredores de bienes raíces, por otro lado, Zillow presenta más dificultades. Le pregunté a un importante corredor de bienes raíces que trabaja en Seattle, el territorio natal de Zillow, su opinión sobre la empresa. Edward Krigsman vende casas multimillonarias en la ciudad y explica algunos de los desafíos:
Los métodos de valoración automatizados existen desde hace décadas, pero Zillow empaquetó esas técnicas para el comercio minorista a gran escala. Esa fue su principal innovación. Sin embargo, los datos de Zillow a menudo no son precisos y es difícil lograr que solucionen los problemas.
Zillow crea expectativas de precios entre los consumidores y se ha convertido en un tercero involucrado en los aspectos de preventa de bienes raíces residenciales. Preciso o no, Zillow afecta la percepción pública del valor de la vivienda.
El impacto de Zillow en el mercado de la industria inmobiliaria es grande y los datos de la empresa tienen una influencia importante en muchas transacciones de viviendas.
Zillow ofrece un ejemplo de libro de texto de cómo los datos pueden cambiar industrias, relaciones y economías establecidas. La empresa matriz, Zillow Group, gestiona varios mercados inmobiliarios que en conjunto generan alrededor de mil millones de dólares en ingresos con, según se informa, una cuota de mercado de audiencia inmobiliaria en línea del 75 por ciento.
Como parte de la serie CXOTALK de conversaciones con innovadores disruptivos, invité al director de análisis de Zillow (que también es su economista jefe), Stan Humphries, a participar en el episodio 234.
La conversación ofrece una mirada fascinante a cómo piensa Zillow sobre los datos, los modelos y su papel en el ecosistema inmobiliario.
Mire el video incluido arriba y lea una transcripción completa en el sitio CXOTALK. Mientras tanto, aquí hay un segmento editado y resumido de nuestra extensa y detallada conversación.
¿Por qué empezaste Zillow?
Siempre ha habido una gran cantidad de datos flotando en torno al sector inmobiliario. Sin embargo, muchos de esos datos fueron en gran medida [hidden] y por eso tenía un potencial no realizado. Como persona que utiliza datos, le encanta encontrar ese espacio.
Los viajes, en los que muchos de nosotros estábamos antes, eran un espacio similar, lleno de datos, pero la gente no había hecho mucho con ellos. Significaba que no pasaría un día en el que no se te ocurriera “¡Mierda! ¡Hagamos esto con los datos!”
En el sector inmobiliario habían surgido múltiples servicios de cotización, que se realizaban entre diferentes agentes y corredores del sector inmobiliario; las viviendas que estaban a la venta.
Sin embargo, el sistema de registro público era completamente independiente de eso, y había dos sistemas de registro público: uno para escrituras y gravámenes sobre bienes inmuebles, y luego otro para las listas de impuestos.
Toda esa era información dispar. Intentamos solucionar el hecho de que todo esto estaba fuera de línea.
Teníamos la sensación de que, desde la perspectiva del consumidor, era como el Mago de Oz, donde todo estaba detrás de esta cortina. No se te permitía detrás de la cortina y realmente [thought]”Bueno, realmente me gustaría ver todas las ventas y descubrir qué está pasando”. Le gustaría que el sitio web le muestre tanto los listados principales de venta como los listados principales de alquiler.
Pero, por supuesto, las personas que le vendieron las casas no querían que usted viera los alquileres junto a ellas porque tal vez podría alquilar una casa en lugar de comprarla. Y pensamos: “Deberíamos poner todo junto, todo en línea”.
Teníamos fe en que ese tipo de transparencia beneficiaría al consumidor.
¿Qué pasa con los agentes inmobiliarios?
Todavía considera que la representación de la agencia es muy importante porque es una transacción muy costosa. Para la mayoría de los estadounidenses, la transacción más cara y el activo financiero más caro que jamás poseerán. Por lo tanto, sigue existiendo una dependencia razonable de un agente para ayudar a tomar de la mano al consumidor mientras compra o vende bienes raíces.
Pero lo que ha cambiado es que ahora los consumidores tienen acceso a la misma información que tiene la representación, ya sea del lado de la compra o de la venta. Eso ha enriquecido el diálogo y ha facilitado la labor de los agentes y intermediarios que están ayudando a la gente. Ahora un consumidor llega al agente con mucha más conciencia y conocimiento, como un consumidor más inteligente. Trabajan con el agente como un socio, donde tienen muchos datos y el agente tiene muchos conocimientos y experiencia. Juntos, creemos que toman mejores decisiones que antes.
¿Cómo ha cambiado Zestimate desde que empezaste?
Cuando lo lanzamos por primera vez en 2006, Zestimate era una valoración que asignamos a cada casa que teníamos en nuestra base de datos en ese momento, que era de 43 millones de casas. Para crear esa valoración en 43 millones de hogares, se ejecutó aproximadamente una vez al mes y pasamos un par de terabytes de datos a través de alrededor de 34 mil modelos estadísticos, lo que fue, en comparación con lo que se había hecho anteriormente, un proceso computacionalmente mucho más sofisticado.
Debería simplemente darles un contexto de cuál era nuestra precisión en aquel entonces. En 2006, cuando lanzamos, teníamos aproximadamente un error porcentual absoluto medio del 14% en 43 millones de hogares.
Desde entonces, hemos pasado de 43 millones de hogares a 110 millones de hogares; Valoramos los 110 millones de viviendas. Y hoy hemos reducido nuestra precisión a aproximadamente el 5 por ciento, lo que, desde una perspectiva de aprendizaje automático, es bastante impresionante.
Esos 43 millones de hogares con los que comenzamos en 2006 tendían a estar en las áreas metropolitanas más grandes donde había mucha velocidad transaccional. Hubo muchas señales de ventas y precios con las que entrenar los modelos. A medida que pasamos de 43 millones a 110, ahora estamos llegando a lugares como Idaho y Arkansas, donde hay menos ventas que observar.
Habría sido impresionante si hubiéramos mantenido nuestra tasa de error en el 14% y al mismo tiempo hubiéramos llegado a lugares que son más difíciles de estimar. Pero no sólo duplicamos nuestra cobertura de 43 a 110 millones de hogares, sino que casi triplicamos nuestra tasa de precisión del 14 por ciento al 5 por ciento.
La historia oculta para lograrlo es recolectar muchísimos más datos y volvernos algorítmicos mucho más sofisticados, lo que requiere que usemos más computadoras.
Solo para dar un contexto, cuando lo lanzamos, construimos 34 mil modelos estadísticos cada mes. Hoy en día, actualizamos Zestimate todas las noches y generamos entre 7 y 11 millones de modelos estadísticos cada noche. Luego, cuando terminemos con ese proceso, los tiramos y volvemos a repetir la noche siguiente. Entonces, es un gran problema de datos.
¿Cuéntanos sobre tus modelos?
Nunca superamos el nivel de condado para el sistema de modelado, y los condados grandes, con muchas transacciones, los dividimos en regiones más pequeñas dentro del condado donde los algoritmos intentan encontrar conjuntos homogéneos de viviendas en el nivel de subcondado para entrenar un modelado. estructura. Ese marco de modelado en sí mismo contiene una enorme cantidad de modelos.
El marco incorpora varias formas diferentes de pensar sobre los valores de las viviendas combinadas con clasificadores estadísticos. Entonces, tal vez sea un árbol de decisiones, pensándolo desde lo que podríamos llamar un enfoque “hedónico” o de características de la vivienda, o tal vez sea una máquina de vectores de soporte que analiza los precios de venta anteriores.
La combinación del enfoque de valoración y el clasificador crea un modelo, y hay varios de estos modelos generados en la geografía de ese subcondado. También hay un montón de modelos que se convierten en metamodelos, cuyo trabajo es reunir estos submodelos en una opinión de consenso final, que es el Zestimate.
¿Cómo se asegura de que sus resultados sean imparciales en la medida de lo posible?
Creemos que el dinero de la publicidad sigue a los consumidores. Queremos ayudar a los consumidores lo mejor que podamos.
Hemos construido, en lenguaje económico, un mercado de dos caras al que llegan consumidores que quieren acceder al inventario y ponerse en contacto con profesionales. En el otro lado de ese mercado, tenemos profesionales (ya sean corredores o agentes de bienes raíces, prestamistas hipotecarios o mejoras de viviendas) que quieren ayudar a esos consumidores a hacer cosas. Estamos tratando de ofrecer un mercado donde los consumidores puedan encontrar inventario y profesionales que los ayuden a hacer las cosas.
Entonces, desde la perspectiva de un creador de mercado versus un participante del mercado, debes ser completamente neutral e imparcial. Lo único que intentamos hacer es conseguirle al consumidor el profesional adecuado y viceversa, y eso es muy importante para nosotros.
Eso significa que, cuando se trata de aplicaciones de aprendizaje automático, por ejemplo, las valoraciones que hacemos, nuestra intención es obtener la mejor estimación del precio de venta de una casa. Nuevamente, desde una perspectiva económica, es diferente del precio de venta del precio de oferta. En el contexto de las materias primas, a esto se le llama diferencial entre la oferta y la demanda entre lo que alguien va a pedir en una oferta.
En el contexto inmobiliario, lo llamamos precio de oferta y precio de venta. Entonces, el precio por el que alguien te ofrecerá vender su casa es diferente a que un comprador diga: “Oye, ¿aceptarías esto?”. Siempre hay una brecha entre eso.
Lo que estamos tratando de hacer con Zestimate es informar algunas decisiones de precios para que el diferencial entre oferta y demanda sea menor. [to prevent] que los compradores se aprovecharan cuando la casa valía mucho menos. Y, [to prevent} sellers from selling a house for a lot less than they could have got because they just don’t know.
We think that having great, competent representation of both sides is one way to mitigate that, which we think is fantastic. Having more information about pricing decision to help you understand that offer-ask ratio, what the offer ask-spread looks like, is very important as well.
How accurate is the Zestimate?
Our models are trained such that half of the Earth will be positive and half will be negative; meaning that on any given day, half of [all] las casas realizarán transacciones por encima del valor de Zestimate y la mitad realizarán transacciones por debajo. Desde el lanzamiento de Zestimate, hemos querido que este sea un punto de partida para una conversación sobre el valor de las viviendas. No es un punto final.
Está destinado a ser un punto de partida para una conversación sobre el valor. Esa conversación, en última instancia, debe involucrar otros medios de valor, incluir a profesionales de bienes raíces como un agente o corredor, o un tasador; personas que tienen un conocimiento experto de las áreas locales y han visto el interior de una casa y pueden compararla con otras casas comparables.
Creo que es un dato influyente y, con suerte, será útil para la gente. Otra forma de pensar en la estadística que acabo de darles es que en un día cualquiera, la mitad de los vendedores venden sus casas por menos del Zestimate y la mitad de los compradores compran una casa por más del Zestimate. Entonces, claramente, están buscando algo más que Zestimate, aunque con suerte les ha sido útil en algún momento de ese proceso.
¿Cómo se han vuelto más sofisticadas tus técnicas con el tiempo?
He estado involucrado en el aprendizaje automático por un tiempo. Comencé en el mundo académico como investigador en un ámbito universitario. Luego, en Expedia, estuve muy…