Litellm

litellm

LiteLLMBase

LiteLLMBase(litellm_model, model_id=None)

Bases: Endpoint

Source code in llmeter/endpoints/litellm.py

def __init__(
    self,
    litellm_model: str,
    model_id: str | None = None,
):
    self.litellm_model = litellm_model
    model_id_inferred, provider, _, _ = get_llm_provider(litellm_model)

    logger.info(f"Using model {model_id_inferred} from provider {provider}")
    super().__init__(
        model_id=model_id or model_id_inferred,
        provider=provider,
        endpoint_name=model_id_inferred,
    )

create_payload `staticmethod`

create_payload(user_message, max_tokens=256, system_message=None, **kwargs)

Create a payload for the LiteLLM completion() request.

Parameters:

Name	Type	Description	Default
`user_message`	`str \| Sequence[str]`	The user's message or a sequence of messages.	required
`max_tokens`	`int`	The maximum number of tokens to generate. Defaults to 256.	`256`
`**kwargs`	`Any`	Additional keyword arguments to include in the payload.	`{}`

Returns:

Name	Type	Description
`dict`	`dict`	The formatted payload for the Bedrock API request.

Source code in llmeter/endpoints/litellm.py

@staticmethod
def create_payload(
    user_message: str | Sequence[str],
    max_tokens: int = 256,
    system_message: str | None = None,
    **kwargs: Any,
) -> dict:
    """
    Create a payload for the LiteLLM `completion()` request.

    Args:
        user_message (str | Sequence[str]): The user's message or a sequence of messages.
        max_tokens (int, optional): The maximum number of tokens to generate. Defaults to 256.
        **kwargs: Additional keyword arguments to include in the payload.

    Returns:
        dict: The formatted payload for the Bedrock API request.
    """

    if isinstance(user_message, str):
        user_message = [user_message]
    payload = {
        "messages": [{"role": "user", "content": k} for k in user_message],
        "max_tokens": max_tokens,
    }
    payload.update(kwargs)
    if system_message:
        payload["messages"].append({"role": "system", "content": system_message})
    return payload

Litellm

litellm

LiteLLMBase

create_payload staticmethod

create_payload `staticmethod`