Diyaloğa dayalı yapay zekaya olan talep artmaya devam ettikçe, kişiselleştirilmiş, insan benzeri etkileşimler sağlayabilen gelişmiş chatbot teknolojilerine olan ihtiyaç da artıyor. Son yıllarda, GPT-4 ve ChatGPT gibi üretken modeller ve LLaMA 3 ve Mixtral 8x7b gibi açık kaynaklı alternatifler, doğal dil girdisini daha önce görülmemiş bir doğruluk ve karmaşıklıkla anlayabilen ve yanıtlayabilen sohbet robotları oluşturmak için umut verici araçlar olarak ortaya çıkmıştır.
Bu makalede, üretken modellerin temellerini ve sohbet robotları oluşturmak için nasıl kullanılabileceklerini keşfedeceğiz.
ChatGPT ve GPT-4, OpenAI tarafından geliştirilen iki gelişmiş dil modelidir. "Chat Generative Pre-training Transformer "ın kısaltması olan ChatGPT, eğitim verilerine dayanarak insan benzeri metinler üretebilen büyük bir dil modelidir. Kasım 2022'de tanıtıldı ve kullanıcılarla konuşma tarzında etkileşime girme, soruları yanıtlama, bilgi sağlama ve çeşitli görevlere katılma becerisiyle hızla yaygın bir ilgi gördü.
GPT-4 veya "Generative Pre-training Transformer 4", GPT-3'ün halefidir ve OpenAI tarafından Mart 2023'te duyurulmuştur. Yapay zeka dil modelleri alanında önemli bir sıçramayı temsil etmekte olup, öncekilere kıyasla daha büyük bir boyuta ve gelişmiş yeteneklere sahiptir. GPT-4, doğal dil işleme, bilgisayar programlama ve yaratıcı yazarlık da dahil olmak üzere çok çeşitli alanlarda son derece ayrıntılı ve doğru metinler üretebilmektedir.
Hem ChatGPT hem de GPT-4, denetimsiz öğrenme kullanılarak büyük miktarda veri üzerinde eğitilmiş ve insan dilini dikkate değer bir doğruluk ve akıcılıkla anlamalarını ve üretmelerini sağlamıştır. Bu modeller, müşteri hizmetleri, eğitim ve eğlence gibi sektörlerde diyalogsal yapay zeka, içerik üretimi ve diğer çeşitli uygulamaların geliştirilmesi için yeni olanaklar yaratmıştır.
Bundan kısa bir süre sonra Meta tarafından LLaMA 3 ve Fransız yapay zeka girişimi Mistral AI tarafından Mixtral 8x7b piyasaya sürüldü. Bu üretken modeller ChatGPT ve GPT-4'ün açık kaynaklı alternatifleridir. Gelişmiş bir sohbet robotu oluşturmak istiyorsanız çok iyi adaylardır. LLaMA 3 ve Mixtral'i kendi sunucularınıza kurabilir ya da NLP Cloud API aracılığıyla kolayca kullanabilirsiniz.
Yine de tüm bu üretken yapay zeka LLM'leri biraz pratik gerektirir. Çünkü bu modellerin beklendiği gibi davranması için doğru yönlendirmelerin yapılması gerekir. Ve ayrıca "durumsuz" oldukları için, yani konuşmalarınızın geçmişini tutmadıkları için.
Bu modellere biraz bağlam ve biçimlendirme olmadan safça istek gönderirseniz, yanıtlar sizi hayal kırıklığına uğratacaktır. Bunun nedeni bu modellerin çok yönlü olmasıdır. Yalnızca sohbet robotları oluşturmaya yardımcı olmakla kalmazlar, aynı zamanda soru yanıtlama, özetleme, açımlama, sınıflandırma, varlık çıkarma, ürün açıklaması oluşturma ve çok daha fazlası gibi birçok başka uygulamaya da yardımcı olabilirler. Bu yüzden yapmanız gereken ilk şey modele hangi "modu" benimsemesi gerektiğini söylemektir.
İşte gönderebileceğiniz bir talep örneği:
This is a discussion between a [human] and an [ai].
The [ai] is very nice and empathetic.
[human]: I broke up with my girlfriend...
[robot]:
Bu örnekte 2 şeye dikkat edebilirsiniz.
İlk olarak, modelin konuşma modunda olduğunu anlaması için basit bir biçimlendirme ekledik: ([human], [ai], ...).
İkinci olarak, modelin ne yaptığını ve kullanması gereken tonu anlamasına yardımcı olmak için en üste bazı bağlamlar ekledik.:
Bu süreci daha basit hale getirmek için hem OpenAI hem de NLP Cloud, bu biçimlendirmeyi sizin için yapan özel chatbot API uç noktaları önermektedir.
Bazen bir bağlam yeterli değildir. Örneğin, çok özel bir ton ve karaktere sahip bir sohbet robotu oluşturmak istediğinizi düşünün. Bu durumda kendi üretken modelinize ince ayar yapmak isteyeceksiniz. OpenAI ve NLP Cloud'da üretken yapay zekaya dayalı kendi sohbet botunuza ince ayar yapabilirsiniz.
Başka bir senaryo da belirli bir alan bilgisiyle ilgili soruları yanıtlayan bir sohbet robotu oluşturmak istemenizdir. Bu durumda ince ayar çözüm değildir. Bunun yerine anlamsal aramaya dayalı kendi erişim artırılmış nesil (RAG) sisteminizi oluşturmak isteyeceksiniz. RAG ve semantik arama hakkındaki özel makalemize buradan ulaşabilirsiniz.
Üretken YZ modelleri "durumsuz" modellerdir, yani yaptığınız her talep yenidir ve YZ yaptığınız önceki talepler hakkında hiçbir şey hatırlamayacaktır.
Birçok kullanım durumu için bu bir sorun değildir (özetleme, sınıflandırma, başka kelimelerle ifade etme...), ancak sohbet robotları söz konusu olduğunda bu kesinlikle bir sorundur çünkü sohbet robotumuzun daha alakalı yanıtlar vermek için tartışma geçmişini ezberlemesini istiyoruz.
Örneğin, yapay zekaya bir programcı olduğunuzu söylerseniz, bunu hafızasında tutmasını istersiniz çünkü bu, vereceği sonraki yanıtlar üzerinde bir etkiye sahip olacaktır.
Bunu başarmanın en iyi yolu, her AI yanıtını yerel bir veritabanında saklamaktır. Örneğin, PostgreSQL veritabanı çok iyi bir verimlilikle uzun metinlerin depolanmasını destekler.
Ardından, sohbet robotuna her yeni istekte bulunduğunuzda aşağıdakileri yapmalısınız:
Bu hem çok az çaba gerektiren çok yönlü ve sağlam bir sistemdir hem de GPT-4, ChatGPT, LLaMA 3 ve Mixtral gibi üretici modellerin gücünden mükemmel bir şekilde yararlanır.
Her modelin, geçmişe ne kadar metin aktarabileceğinizi belirleyecek kendi bağlam boyutuna sahip olduğuna dikkat etmek önemlidir. Örneğin GPT-4 için geçerli bağlam boyutu 8 bin token (yani aşağı yukarı 7 bin kelime) ve Mixtral 8x7b'nin geçerli bağlam boyutu NLP Cloud'da 16 bin token'dır (yani aşağı yukarı 14 bin kelime). Dolayısıyla, konuşma geçmişiniz bunun üzerindeyse, geçmişin en eski kısmını kesmek ya da tartışmaların yalnızca en önemli kısımlarını saklamak isteyebilirsiniz.
OpenAI, ChatGPT ve GPT-4 üzerinde içerik kısıtlamaları uygulayarak yapay zeka tarafından oluşturulan metnin kendi yönergelerine uymasını sağlamıştır. OpenAI, sohbet robotları tarafından üretilen içeriği izleyerek ve düzenleyerek daha olumlu ve güvenilir bir kullanıcı deneyimi yaratmayı amaçlamaktadır. Bu, belirli konulardaki bilgi taleplerini engellemeyi veya yalnızca önceden incelenmiş, güvenilir bilgiler sağlamayı içerir.
Bazıları bu tür kısıtlamalara sahip olmayan üretken modelleri kullanmayı tercih etmekte ve yanıtların kalitesini daha çeşitli ve doğru bulmaktadır. LLaMA 3 ve Mixtral 8x7b bu tür kısıtlamalara sahip değildir. Bu tür yapay zeka modellerini kullanırken, yapay zekayı sorumlu bir şekilde kullanmak geliştiricinin sorumluluğundadır. Gerekirse, sohbet botu için doğru istem oluşturarak, kendi sohbet botunuza ince ayar yaparak veya kullanıcı isteklerini YZ modeline ulaşmadan önce filtreleyerek sınırlamalar yine de uygulanabilir.
GPT-4, ChatGPT, LLaMA 3 ve Mixtral 8x7b gibi üretken yapay zeka modelleri, sohbet robotlarını ve diyalogsal yapay zekayı gerçekten bir sonraki seviyeye taşıdı. Bu gelişmiş modeller, bağlamınızı anlama ve ona uyum sağlama konusunda çok iyidir. Çoğu durumda, doğru bağlamı ayarlamak yeterlidir, ancak gelişmiş kullanım durumları için en iyi çözüm kendi AI modelinizi eğitmek / ince ayar yapmaktır (bu modeller çok küçük veri kümeleri gerektirdiğinden oldukça kolaydır).
NLP Cloud'da diğer modellerin yanı sıra LLaMA 3 ve Mixtral 8x7b'yi kolayca deneyebilirsiniz. Ayrıca bunlara ince ayar yapabilir ve kendi özel üretken yapay zeka modellerinizi tek bir tıklamayla dağıtabilirsiniz. Henüz yapmadıysanız, NLP Cloud'u ücretsiz deneyin.
Kendi chatbotunuzu nasıl uygulayacağınız hakkında sorularınız varsa, lütfen bizimle iletişime geçmekten çekinmeyin!
François