# Agents dans LlamaIndex

Ce notebook fait parti du cours sur les agents d'Hugging Face, un cours gratuit qui vous guidera, du **niveau débutant à expert**, pour comprendre, utiliser et construire des agents.



## Installons les dépendances

Nous allons installer les dépendances pour cette unité.

In [None]:
!pip install llama-index llama-index-vector-stores-chroma llama-index-llms-huggingface-api llama-index-embeddings-huggingface -U -q

Nous allons également nous connecter au Hugging Face Hub pour avoir accès à l'API d'inférence.

In [None]:
from huggingface_hub import login

login()

## Initialisation des agents

Commençons par initialiser un agent. Nous allons utiliser la classe de base `AgentWorkflow` pour créer un agent.

In [None]:
from llama_index.llms.huggingface_api import HuggingFaceInferenceAPI
from llama_index.core.agent.workflow import AgentWorkflow, ToolCallResult, AgentStream


def add(a: int, b: int) -> int:
 """Add two numbers"""
 return a + b


def subtract(a: int, b: int) -> int:
 """Subtract two numbers"""
 return a - b


def multiply(a: int, b: int) -> int:
 """Multiply two numbers"""
 return a * b


def divide(a: int, b: int) -> int:
 """Divide two numbers"""
 return a / b


llm = HuggingFaceInferenceAPI(model_name="Qwen/Qwen2.5-Coder-32B-Instruct")

agent = AgentWorkflow.from_tools_or_functions(
 tools_or_functions=[subtract, multiply, divide, add],
 llm=llm,
 system_prompt="You are a math agent that can add, subtract, multiply, and divide numbers using provided tools.",
)

Ensuite, nous pouvons exécuter l'agent et obtenir la réponse et le raisonnement qui sous-tend les appels à l'outil.

In [None]:
handler = agent.run("What is (2 + 2) * 2?")
async for ev in handler.stream_events():
 if isinstance(ev, ToolCallResult):
 print("")
 print("Called tool: ", ev.tool_name, ev.tool_kwargs, "=>", ev.tool_output)
 elif isinstance(ev, AgentStream): # montrer le processus de réflexion
 print(ev.delta, end="", flush=True)

resp = await handler
resp

De la même manière, nous pouvons transmettre l'état et le contexte à l'agent.

In [27]:
from llama_index.core.workflow import Context

ctx = Context(agent)

response = await agent.run("My name is Bob.", ctx=ctx)
response = await agent.run("What was my name again?", ctx=ctx)
response

AgentOutput(response=ChatMessage(role=, additional_kwargs={}, blocks=[TextBlock(block_type='text', text='Your name is Bob.')]), tool_calls=[], raw={'id': 'chatcmpl-B5sDHfGpSwsVyzvMVH8EWokYwdIKT', 'choices': [{'delta': {'content': None, 'function_call': None, 'refusal': None, 'role': None, 'tool_calls': None}, 'finish_reason': 'stop', 'index': 0, 'logprobs': None}], 'created': 1740739735, 'model': 'gpt-4o-2024-08-06', 'object': 'chat.completion.chunk', 'service_tier': 'default', 'system_fingerprint': 'fp_eb9dce56a8', 'usage': None}, current_agent_name='Agent')

## Création d'agents de RAG avec QueryEngineTools

Réutilisons maintenant le `QueryEngine` que nous avons défini dans [l'unité précédente sur les outils](/tools.ipynb) et convertissons-le en un `QueryEngineTool`. Nous allons le passer à la classe `AgentWorkflow` pour créer un agent de RAG.

In [46]:
import chromadb

from llama_index.core import VectorStoreIndex
from llama_index.llms.huggingface_api import HuggingFaceInferenceAPI
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core.tools import QueryEngineTool
from llama_index.vector_stores.chroma import ChromaVectorStore

# Créer un vector store
db = chromadb.PersistentClient(path="./alfred_chroma_db")
chroma_collection = db.get_or_create_collection("alfred")
vector_store = ChromaVectorStore(chroma_collection=chroma_collection)

# Créer un moteur de recherche
embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-small-en-v1.5")
llm = HuggingFaceInferenceAPI(model_name="Qwen/Qwen2.5-Coder-32B-Instruct")
index = VectorStoreIndex.from_vector_store(
 vector_store=vector_store, embed_model=embed_model
)
query_engine = index.as_query_engine(llm=llm)
query_engine_tool = QueryEngineTool.from_defaults(
 query_engine=query_engine,
 name="personas",
 description="descriptions for various types of personas",
 return_direct=False,
)

# Créer un agent de RAG
query_engine_agent = AgentWorkflow.from_tools_or_functions(
 tools_or_functions=[query_engine_tool],
 llm=llm,
 system_prompt="You are a helpful assistant that has access to a database containing persona descriptions. ",
)

Et nous pouvons une fois de plus obtenir la réponse et le raisonnement derrière les appels d'outils.

In [None]:
handler = query_engine_agent.run(
 "Search the database for 'science fiction' and return some persona descriptions."
)
async for ev in handler.stream_events():
 if isinstance(ev, ToolCallResult):
 print("")
 print("Called tool: ", ev.tool_name, ev.tool_kwargs, "=>", ev.tool_output)
 elif isinstance(ev, AgentStream): # montrer le processus de réflexion
 print(ev.delta, end="", flush=True)

resp = await handler
resp

## Créer des systèmes multi-agents

Nous pouvons également créer des systèmes multi-agents en passant plusieurs agents à la classe `AgentWorkflow`.

In [None]:
from llama_index.core.agent.workflow import (
 AgentWorkflow,
 ReActAgent,
)


# Définir quelques outils
def add(a: int, b: int) -> int:
 """Add two numbers."""
 return a + b


def subtract(a: int, b: int) -> int:
 """Subtract two numbers."""
 return a - b


# Créer les configurations de l'agent
# NOTE : nous pouvons utiliser FunctionAgent ou ReActAgent ici.
# FunctionAgent fonctionne pour les LLM avec une API d'appel de fonction.
# ReActAgent fonctionne pour n'importe quel LLM.
calculator_agent = ReActAgent(
 name="calculator",
 description="Performs basic arithmetic operations",
 system_prompt="You are a calculator assistant. Use your tools for any math operation.",
 tools=[add, subtract],
 llm=llm,
)

query_agent = ReActAgent(
 name="info_lookup",
 description="Looks up information about XYZ",
 system_prompt="Use your tool to query a RAG system to answer information about XYZ",
 tools=[query_engine_tool],
 llm=llm,
)

# Créer et exécuter le workflow
agent = AgentWorkflow(agents=[calculator_agent, query_agent], root_agent="calculator")

# Exécuter le système
handler = agent.run(user_msg="Can you add 5 and 3?")

In [None]:
async for ev in handler.stream_events():
 if isinstance(ev, ToolCallResult):
 print("")
 print("Called tool: ", ev.tool_name, ev.tool_kwargs, "=>", ev.tool_output)
 elif isinstance(ev, AgentStream): # showing the thought process
 print(ev.delta, end="", flush=True)

resp = await handler
resp