Aaj News

جمعہ, نومبر 22, 2024  
19 Jumada Al-Awwal 1446  

مصنوعی ذہانت آپ کی شاعری کو گیتوں میں تبدیل کرے گی

اسٹیبلٹی اے آئی نے اپنا پہلا ٹیکسٹ ٹو آڈیو اے آئی پلیٹ فارم لانچ کردیا
اپ ڈیٹ 14 ستمبر 2023 12:57pm
تصویر: فائل فوٹو
تصویر: فائل فوٹو

لندن میں قائم جنریٹیومصنوعی ذہانت (اے آئی) کمپنی اسٹیبلٹی اے آئی نے حال ہی میں اسٹیبل آڈیو نامی ایک نیا اور منفرد ٹیکسٹ ٹو آڈیو پلیٹ فارم متعارف کروایا ہے۔

مصنوعی ذہانت سے چلنے والا یہ پلیٹ فارم میوزک اور ساؤنڈ جنریشن میں کمپنی کے پہلے قدم کی نمائندگی کرتا ہے جوکہ 90 سیکنڈ تک کے گانے تیار کرسکتا ہے۔

یہ کمپنی مصنوعی ذہانت کی دنیا میں سب سے نمایاں رہی ہے۔ تاہم یہ زیادہ تر مصنوعی ذہانت سے پیدا ہونے والے مناظر کے لیے ہی جانی جاتی تھی۔

ٹیکسٹ ٹو آڈیو پر مبنی اسٹیبل آڈیو میں ماڈل کو تصاویر کے بجائے آڈیو ڈیٹا کے ساتھ تربیت دی گئی ہے۔ اس سے صارفین کسی بھی گانے یا بیک گراؤنڈ آڈیوکو تیار کرسکتے ہیں، جس سے یہ مختلف پروجیکٹس کے لیے ایک ورسٹائل ٹول بن سکتا ہے۔

مزید پڑھیں:

گوگل میں دوسروں کو نوکری سے نکالنے والے سینکڑوں ملازمین خود برطرف

گوگل پر مارکیٹ میں غلبہ برقرار رکھنے کیلئے سالانہ 10 ارب ڈالر ادا کرنے کا الزام

فون میں انٹرنیٹ کی راکٹ جیسی رفتار چاہتے ہیں تو فوراً یہ سیٹنگز تبدیل کرلیں

اسٹیبل آڈیو پلیٹ فارم حقیقت میں میوزک پروڈکشن کے لیے ایک قابلِ قدر اقدام ہے۔

اس سے پہلے آڈیو ڈیفیوژن ماڈلز صرف مقررہ مدت کے آڈیو کلپس تیار کرسکتے تھے جس سے ان کی مکمل گانے تیار کرنے کی صلاحیت محدود ہوگئی تھی۔

اسٹیبلٹی اے آئی نے صارفین کو تیار کردہ گانے کے دورانیے میں لچک فراہم کرنے کے لیے اس ماڈل کو بہتر بنایا ہے۔

کمپنی کی جانب سے جاری بیان میں کہا گیا ہے کہ ’اسٹیبل آڈیو اسٹیبلٹی اے آئی(مصنوعی ذہانت) کی جنریٹیو آڈیو ریسرچ لیب ہارمونائی کی جدید ترین آڈیو جنریشن ریسرچ کی نمائندگی کرتی ہے، ہم آؤٹ پٹ کوالٹی، کنٹرول ایبیلٹی، تخمینے کی رفتار اور آؤٹ پٹ کی لمبائی کو بہتر بنانے کے لیے اپنے ماڈل آرکیٹیکچر، ڈیٹا اسیٹس اور تربیتی طریقہ کار کو بہتر بنانا جاری رکھتے ہیں‘۔

کمپنی کے بیان کے مطابق اسٹیبل آڈیو پلیٹ فارم کو 8 لاکھ سے زائد آڈیو فائلز کے وسیع ڈیٹا سیٹ کا استعمال کرتے ہوئے تربیت دی گئی ہے جس میں موسیقی، صوتی اثرات اور انفرادی آلہ اسٹیمز شامل ہیں۔

ڈیٹا سیٹ میں اسٹاک میوزک لائسنسنگ کمپنی آڈیو اسپارکس کا ٹیکسٹ میٹا ڈیٹا بھی شامل ہے۔ یہ جامع ڈیٹا سیٹ ساڑھے 19 ہزار گھنٹوں کی آوازوں کا احاطہ کرتا ہے۔

کمپنی پلیٹ فارم کو استعمال کرنے کے لئے صارفین کو تین مختلف قیمتوں کی درجہ بندی پیش کررہی ہے۔

  • یہ صارفین کو ہر ماہ مفت زیادہ سے زیادہ 20 ٹریکس کے لیے 45 سیکنڈ تک آڈیو بنانے کی صلاحیت فراہم کرتا ہے۔

  • پروفیشنل لیول کی قیمت 12 ڈالر ہے، اس میں صارفین 500 ٹریک بنا سکتے ہیں، جن میں سے ہر ایک کا دورانیہ 90 سیکنڈ تک ہوگا۔

  • انٹر پرائز سبسکرپشن صرف ان کمپنیوں کے لیے ہی دستیاب ہوگا جو اپنی مرضی کے مطابق پلیٹ فارم کو استعمال کریں گے۔

TECHNOLOGY

Artificial Intelligence

Song

Text to audio