Analizador de plantas con IA! 馃尡

Analizador de plantas con IA! 馃尡

Tabla de contenidos

He desarrollado un analizador de plantas impulsado por IA que combina herramientas avanzadas del OpenAI Vision API y Tavily, con capacidades de b煤squeda para explorar informaci贸n en gardenia.net.

馃尶 隆Con esta herramienta, identificar plantas y acceder a informaci贸n detallada sobre su cuidado nunca ha sido tan f谩cil! En este video, explico el proceso de creaci贸n, detallando los pasos t茅cnicos y las decisiones detr谩s de la construcci贸n de una IA que ayuda tanto a entusiastas de las plantas como a expertos a comprender y cuidar mejor sus plantas.

馃帴 Mira el video para conocer m谩s sobre c贸mo funciona este analizador de IA y el potencial que tiene para el mundo de la horticultura. 隆Hagamos que el cuidado de las plantas sea m谩s inteligente, juntos!

Revisemos los detalles

Este c贸digo nos permite cargar una imagen directamente desde una carpeta espec铆fica, lo que facilita el acceso y la manipulaci贸n de archivos de imagen almacenados localmente.

    def load_image(inputs: dict) -> dict:
        image_path = inputs["image_path"]
        
        def encode_image(image_path):
            with open(image_path, "rb") as image_file:
                return base64.b64encode(image_file.read()).decode("utf-8")
        
        image_base64 = encode_image(image_path)
        return {"image": image_base64}
    
    
    load_image_chain = TransformChain(
        input_variables=["image_path"], output_variables=["image"], transform=load_image
    )

Necesitamos definir un modelo que servir谩 como salida del Modelo de Aprendizaje de Lenguaje (LLM). En este caso, el modelo generar谩 informaci贸n sobre el nombre de la planta y proporcionar谩 una evaluaci贸n de su estado de salud.

    class PlantInformation(BaseModel):
        name: str = Field(
            example="Sansevieria",
            description="The name of the plant or Not a plant",
        )
        healthy: bool = Field(
            example="True",
            description="If the plant looks good or not",
        )

Desarrollamos la herramienta que utilizar谩 el Modelo de Aprendizaje de Lenguaje (LLM) para analizar la imagen, permiti茅ndole extraer informaci贸n relevante de los datos visuales.

    def image_model(inputs: dict) -> str | list[str | dict[Any, Any]]:
        model = AzureChatOpenAI(
            azure_deployment=os.environ['AZURE_OPENAI_DEPLOYMENT'],
            model_version="2024-05-13",
            api_version="2024-02-01",
            temperature=0
        )
        msg = model.invoke(
                [
                    HumanMessage(
                        content=[
                            {"type": "text", "text": inputs["prompt"]},
                            {"type": "text", "text": parser.get_format_instructions()},
                            {
                                "type": "image_url",
                                "image_url": {
                                    "url": f"data:image/jpeg;base64,{inputs['image']}"
                                }
                            }
                        ]
                    )
                ]
            )
        return msg

Este c贸digo invocar谩 la herramienta utilizando el modelo especificado y el mensaje proporcionado para analizar la imagen. La herramienta procesar谩 la informaci贸n visual y devolver谩 los resultados en un formato estructurado de respuesta JSON.

    def get_image_information(image_path: str) -> dict:
        vision_prompt = """Analyze the image to get the name of the plant. Also analyze the health status of the plant. Answer Not a plant when is not a plant
        # Example 1: 
        name: Sansevieria
        healthy: True
        # Example 2: 
        name: Spathiphyllum
        healthy: False
        """
        vision_chain = load_image_chain | image_model | parser
        try:
            return vision_chain.invoke(
                {"image_path": f"{image_path}", "prompt": vision_prompt}
            )
        except OutputParserException:
            return {
                "name": "Not a plant",
                "healthy" : False
                
            }
        except Exception:
            return {
                "name": "Not a plant",
                "healthy" : False
            }

Utilic茅 la funci贸n de b煤squeda de Tavily para encontrar informaci贸n sobre el nombre de la planta identificada, junto con consejos 煤tiles para su cuidado, completando as铆 el proceso.

    tool = TavilySearchResults(
        max_results=1,
        search_depth="advanced",
        include_answer=True,
        include_raw_content=True,
        include_images=True,
        include_domains=["https://www.gardenia.net/"]
    )
    if(result['healthy']):
        response = tool.invoke({"query": result["name"]})
    else:
        response = tool.invoke({"query": result["name"] + " plant care tips"})

Desde la identificaci贸n hasta la generaci贸n de informaci贸n, 隆este proyecto ha sido una experiencia gratificante que combina mi pasi贸n por la tecnolog铆a y la naturaleza!

馃挕Puntos clave del PoC

  • ElevenLabs: Voz generada autom谩ticamente para el video basada en un guion creado con ChatGPT.
  • Tavily: B煤squeda en la web para obtener informaci贸n sobre las plantas.
  • Toolkit: Cadena de preguntas y respuestas de LangChain para generar una salida en formato JSON a partir de un texto dado.
  • Modelo: OpenAI 4o

Posts relacionados

Crea un podcast sin intervenci贸n humana

Crea un podcast sin intervenci贸n humana

Google Notebook LM est谩 revolucionando la investigaci贸n impulsada por IA, la creaci贸n de contenido y la organizaci贸n de datos. Esta herramienta proporciona informaci贸n estructurada, lo que la hace ideal para investigadores, creadores de contenido y entusiastas de la IA.

Leer m谩s
Guardrails para las LLMs: asegura un sistema de AI seguro y confiable para banco Loredo

Guardrails para las LLMs: asegura un sistema de AI seguro y confiable para banco Loredo

La r谩pida evoluci贸n de los Modelos de Lenguaje Grande (LLMs) ha desbloqueado aplicaciones transformadoras, desde la generaci贸n de contenido hasta la toma de decisiones automatizada. Sin embargo, la implementaci贸n de LLMs en sistemas del mundo real requiere mecanismos s贸lidos de seguridad y confiabilidad. Este post explora los controles esenciales, el papel de Pydantic como analizador de salida y las preocupaciones de seguridad en enfoques de IA agente.

Leer m谩s
C贸mo construir un panel en Azure Cloud utilizando consultas de App Insights con KQL generadas por un LLM

C贸mo construir un panel en Azure Cloud utilizando consultas de App Insights con KQL generadas por un LLM

Construir un panel robusto y 煤til en Azure Application Insights con KQL (Kusto Query Language) permite a los equipos de desarrollo monitorear y analizar el rendimiento de su aplicaci贸n y el comportamiento de los usuarios. Esta gu铆a te llevar谩 a trav茅s de la creaci贸n de un panel con ejemplos de KPIs y gr谩ficos correspondientes. No s茅 nada sobre KQL, pero usar茅 una LLM para generar las consultas que necesito.

Leer m谩s