LLM Embedding

The LLMEmbedding class is a component in the llamarch library that provides a simple interface to work with LLM embeddings. These provide a way to embed text into a vector space, which can be useful for various applications.

Note that Cohere and OpenAI integrations are still under development and might not be fully functional.

`LLMEmbedding`

Source code in llamarch/common/llm_embedding.py

class LLMEmbedding:
    def __init__(self,
                 model_category: str,
                 embedding_model_name: str,
                 api_key: Optional[str] = None,
                 model_parameters: Optional[Dict[str, Any]] = None):
        """
        Initialize the LLM embedding client and (optionally) a separate embedding model based on specified names.

        Parameters
        ----------
        model_category : str
            The name of the language model provider (e.g., 'openai', 'huggingface', 'cohere').
        embedding_model_name : str
            The name of the embedding model.
        api_key : str, optional
            The API key for the selected provider. Default is None.
        model_parameters : dict, optional
            Additional parameters for model configuration. Default is an empty dictionary if not provided.
        """
        self.model_category = model_category.lower()
        self.embedding_model_name = embedding_model_name.lower(
        ) if embedding_model_name else None
        self.api_key = api_key
        self.model_parameters = model_parameters or {}

        # Initialize the language model and embedding model
        self.embedding_model = self._initialize_embeddings()

    def _initialize_embeddings(self):
        """
        Initialize the embedding model based on the specified category.

        Returns
        -------
        object
            The initialized embedding model corresponding to the selected provider.

        Raises
        ------
        ValueError
            If an unsupported model category is provided.
        """
        if self.model_category == "openai":
            from langchain_openai import OpenAIEmbeddings
            return OpenAIEmbeddings(
                openai_api_key=self.api_key,
                model=self.embedding_model_name or "text-embedding-ada-002"
            )
        elif self.model_category == "huggingface":
            from langchain_huggingface import HuggingFaceEmbeddings
            return HuggingFaceEmbeddings(
                model_name=self.embedding_model_name,
                encode_kwargs={"device": "cpu", "batch_size": 32}
            )
        elif self.model_category == "cohere":
            from langchain_community.embeddings import CohereEmbeddings
            return CohereEmbeddings(
                cohere_api_key=self.api_key,
                model=self.embedding_model_name
            )
        else:
            raise ValueError(
                f"Unsupported model category: {self.model_category}")

    def get_embeddings(self, text: str) -> List[float]:
        """
        Get embeddings for a given text using the specified embedding model.

        Parameters
        ----------
        text : str
            The input text for which embeddings are needed.

        Returns
        -------
        List[float]
            The embedding vector for the input text.
        """
        return self.embedding_model.embed_query(text)

`init(model_category, embedding_model_name, api_key=None, model_parameters=None)`

Initialize the LLM embedding client and (optionally) a separate embedding model based on specified names.

Parameters:

model_category (str) –

The name of the language model provider (e.g., 'openai', 'huggingface', 'cohere').
embedding_model_name (str) –

The name of the embedding model.
api_key (str, default: None ) –

The API key for the selected provider. Default is None.
model_parameters (dict, default: None ) –

Additional parameters for model configuration. Default is an empty dictionary if not provided.

Source code in llamarch/common/llm_embedding.py

def __init__(self,
             model_category: str,
             embedding_model_name: str,
             api_key: Optional[str] = None,
             model_parameters: Optional[Dict[str, Any]] = None):
    """
    Initialize the LLM embedding client and (optionally) a separate embedding model based on specified names.

    Parameters
    ----------
    model_category : str
        The name of the language model provider (e.g., 'openai', 'huggingface', 'cohere').
    embedding_model_name : str
        The name of the embedding model.
    api_key : str, optional
        The API key for the selected provider. Default is None.
    model_parameters : dict, optional
        Additional parameters for model configuration. Default is an empty dictionary if not provided.
    """
    self.model_category = model_category.lower()
    self.embedding_model_name = embedding_model_name.lower(
    ) if embedding_model_name else None
    self.api_key = api_key
    self.model_parameters = model_parameters or {}

    # Initialize the language model and embedding model
    self.embedding_model = self._initialize_embeddings()

`get_embeddings(text)`

Get embeddings for a given text using the specified embedding model.

Parameters:	`text` (`str`) – The input text for which embeddings are needed.

Returns:	`List[float]` – The embedding vector for the input text.

Source code in llamarch/common/llm_embedding.py

def get_embeddings(self, text: str) -> List[float]:
    """
    Get embeddings for a given text using the specified embedding model.

    Parameters
    ----------
    text : str
        The input text for which embeddings are needed.

    Returns
    -------
    List[float]
        The embedding vector for the input text.
    """
    return self.embedding_model.embed_query(text)

LLM Embedding

LLMEmbedding

__init__(model_category, embedding_model_name, api_key=None, model_parameters=None)

get_embeddings(text)

`LLMEmbedding`

`init(model_category, embedding_model_name, api_key=None, model_parameters=None)`

`get_embeddings(text)`