FREE and Open Base Model Available on Hugging Face !
Hugging Face
Empowering Maharashtra and India with Artificial Intelligence
MahaMarathi 7B, is a domain-adapted, continually pre-trained, and instruction fine-tuned native Marathi Large Language Model (LLM) with 7 billion parameters demonstrating superior performance in various natural language processing tasks.
Marathi is a language predominantly spoken in the Indian state of Maharashtra, with over 83 million native speakers. It ranks 13th globally in terms of native speakers and is the third most common language in India. Maharashtra is a powerhouse and the largest contributor to India's economy with Marathi businesses and consumers contributing over 15% of Indian GDP, and a rapidly growing state economy at a CAGR of over 10% with a GSDP of over ₹38.79 trillion (US$486 billion)
To promote broad access and applications of Marathi LLM with the goal of democratizing machine learning research for businesses and e-governance, we release the initial version of the pre-trained base model on HuggingFace . Startups and organizations are encouraged to innovate by developing fine-tuned models for various use cases, and we are happy to offer support or advice. We plan to release the instruction-tuned and preference-optimized models in the coming months.
This is our little contribution to AI for Maharashtra, and an attempt to make people's lives easier.
A collaboration between Dr. Aakash Patil (Stanford University), Mrunmayee Shende (CourtEasy.ai), and Niraj Kumar Singh (IIT Madras Alumnus) have released the first Marathi Large Language Model(LLM). This artificial intelligence Large Language Model is capable of handling complex conversations and instructions in Marathi, a language spoken by more than 83 million people. The computing resources for this collaborative research were provided by CourtEasy.ai which is developing generative AI technology for legal professionals. For more details, please reach out to mrunmayee.shende@courteasy.ai
आर्टिफिशियल इंटेलिजन्सने महाराष्ट्राला व भारताला सक्षम बनवणे
महामराठी हे ७ अब्ज पॅरामीटर्स वापरून पूर्व-प्रशिक्षित आणि सुचनांच्या आधारे फाईन ट्यून केलेले मूळ मराठी महाभाषा समीकरण संच आहे ज्याला लार्ज लँग्वेज मॉडेल (एल. एल. एम.) असेही म्हणतात. ८३ दशलक्षाहून अधिक स्थानिक भाषिकांसाठी तयार केलेले हे कृत्रिम बुद्धिमत्तेवर (ए. आय.) आधारित तंत्रज्ञान आहे जे मराठीतील कठीण संभाषणे आणि सूचना सहज हाताळण्यास सक्षम आहे.
आज संपूर्ण जग तंत्रज्ञानावर सुरु आहे. गेल्या ६ महिन्यांत ए. आय. तंत्रज्ञानामुळे झपाट्याने बदल झाले आहेत. या तंत्रज्ञानामधे लोकांचे आयुष्य बदलून टाकण्याची क्षमता आहे. कौशल्य प्रशिक्षण आणि शिक्षण, आरोग्य, कृषी, पर्यावरण, नगर नियोजन, वाहतूक नियोजन अशा अनेक क्षेत्रांमध्ये या तंत्रज्ञानाचे मोठे योगदान ठरू शकते . शासकीय सेवांमध्ये नाविन्यता आणून,सर्वसामान्य माणसापर्यंत शासकीय योजना प्रभाविपणे पोहचविण्यासाठी कृत्रिम बुद्धिमत्तेवर आधारित लार्ज लँग्वेज मॉडेल चा उपयोग होईल. भारताच्या अर्थव्यवस्थेत सर्वात मोठे योगदान देणारे महाराष्ट्रातील व्यावसायिक व ग्राहक यांचे भारताच्या एकूण देशांतर्गत उत्पादनामध्ये १५ % पेक्षा जास्त योगदान आहे. स्टार्ट अप कॅपिटल असलेल्या महाराष्ट्र राज्यातील स्टार्टअप इको सिस्टीमला आणि उद्योजकता विकासाला देखील हे तंत्रज्ञान उपलब्ध होईल.
व्यवसाय आणि ई-गव्हर्नन्समध्ये मराठी एलएलएमच्या आणि मशीन लर्निंग संशोधनाचा प्रसार करण्याच्या उद्दिष्टासह व्यापक विनियोगांना प्रोत्साहन देण्यासाठी, संशोधकांनी पूर्व-प्रशिक्षित बेस मॉडेलची प्रारंभिक आवृत्ती सर्वांसाठी मोफत खुली केली आहे. स्टार्टअप्स आणि संस्थांना विविध वापरांसाठी फाईन-ट्यून केलेले मॉडेल विकसित करून नवनिर्मितीसाठी वापरता येईल. येत्या काही महिन्यांत सूचना देऊन ट्यून केलेले आणि प्राधान्य-अनुकूलित मॉडेल्स रिलीज करण्याची योजना आहे. सर्वांसाठी खुली आणि मोफत आवृत्ती हग्गीन्गफेस ह्या संकेतस्थळावर उपलब्ध केली आहे ज्याचा वापर डेव्हलपर्स, विविध शासकीय व खाजगी संस्था, विविध कामांसाठी करून त्यांचे योगदान मराठी भाषेसाठी तयार केलेल्या कृत्रिम बुद्धिमत्ता तंत्रज्ञानाला देऊ शकतात.
ए. आय. फॉर महाराष्ट्र साठी संशोधकांचे हे छोटेसे योगदान असून लोकांचं जीवन सुकर करण्याचा हा प्रयत्न आहे.
डॉ. आकाश पाटील (संशोधक - स्टॅनफोर्ड विद्यापीठ) , मृण्मयी शेंडे (संस्थापक - कोर्ट इझी ए.आय.) आणि निरज सिंग (माजी विद्यार्थी - आय. आय. टी. मद्रास) यांनी मिळून जगातील पहिले मराठी लार्ज लँग्वेज मॉडेल (LLM) विकसित केले आहे. कोर्ट इझी ए.आय. ही कायदा व न्याय व्यवस्थेसाठी साठी जेनेरेटिव्ह ए. आय. ची उभारणी करत आहे आणि त्यांनी ह्या संशोधनाला महा संगणक उपलब्ध करून दिला. अधिक माहितीसाठी कृपया mrunmayee.shende@courteasy.ai वर ई-मेल करा.
Startups and organizations are encouraged to innovate by developing fine-tuned models for various use cases. We are happy to offer support or advice.
Get Support