Red Hat, Inc. en Elastic hebben een uitgebreide samenwerking aangekondigd om de volgende generatie zoekervaringen te leveren die retrieval augmented generation (RAG)-patronen ondersteunen met behulp van Elasticsearch als voorkeursoplossing voor vectordatabases, geïntegreerd op Red Hat OpenShift AI. Met deze samenwerking bieden Red Hat en Elastic bedrijven de tools die ze nodig hebben om RAG-oplossingen te leveren, te onderhouden en te verfijnen op één consistent platform. Nu organisaties te maken hebben met de tweeledige eis om AI-oplossingen toe te voegen aan hun activiteiten en tegelijkertijd de risico's te minimaliseren, staat RAG centraal bij het integreren van grote taalmodellen (LLM) in bedrijfsapplicaties.

RAG stelt IT-teams in staat om de voordelen van LLM's te combineren met privégegevensopslag om modellen te trainen met gerichte, privégegevens zonder het onderliggende model zelf te wijzigen. Sterke zoekfunctie is essentieel, omdat het kostbaar kan zijn om LLM's op schaal de juiste informatie te geven met behulp van privéopslagplaatsen. Opzoeken met rolgebaseerde besturingselementen helpt om de bescherming rond gevoelige gegevens te behouden, terwijl ze toch gebruikt kunnen worden voor het trainen van LLM's voor algemene doeleinden. Red Hat OpenShift AI en Elasticsearch kunnen organisaties helpen om het meeste uit RAG te halen op zowel MLOps-infrastructuur- als applicatieniveau.

Red Hat OpenShift AI biedt een vertrouwd machine learning operations (MLOps) platform om modellen op schaal te automatiseren, bouwen, tunen, implementeren en monitoren. Tegelijkertijd levert Elasticsearch een vectordatabase en robuuste hybride zoekoplossing voor het schalen en extraheren van AI-reacties, met geavanceerde zoek- en beveiligingsfuncties om resultaten beter toepasbaar te maken voor eindgebruikers. Red Hat ondersteunt de tools van Elasticsearch voor ontwikkelaars van RAG- en generatieve AI-toepassingen (GenAI) met behulp van de Elasticsearch Relevance EngineTM (ESRETM), die ingebouwde vectorzoek- en transformatormodellen bevat, waarmee ontwikkelaars de volgende generatie zoekopdrachten kunnen bouwen met eigen bedrijfsgegevens.

ESRE stelt organisaties in staat om implementaties te creëren die geoptimaliseerd zijn voor beveiliging met behulp van hun eigen gestructureerde en ongestructureerde data, en stelt ontwikkelaars in staat om semantische zoek- en RAG-toepassingen te bouwen met behulp van een verscheidenheid aan machine learning (ML)-modellen van derden, evenals ecosysteemtooling van providers zoals Cohere, LangChain en LlamaIndex. Red Hat OpenShift AI in combinatie met Elasticsearch maakt diepere en uitgebreidere klantenondersteuning mogelijk, evenals verdere innovatie en integratie met het uitgebreide ecosysteem van AI-partners van Red Hat. Succesvolle implementaties van GenAI helpen het vertrouwen in AI-oplossingen op te bouwen, wat leidt tot meer AI-adoptie en uiteindelijk tot meer keuze voor gebruikers in de AI-markt.

Deze uitbreiding van Red Hat's bestaande samenwerking met Elastic is een voorbeeld van de positieve impact die AI kan hebben op zakelijke toepassingen en de bredere markt. Door bedrijven tegemoet te komen waar ze zich bevinden bij de invoering van AI, helpt Red Hat hen om vaak onderbenutte gegevens te benutten, wat een belangrijke differentiator voor organisaties kan zijn.