توکن سازی (Tokenization)، فرآیند ایجاد یک نمایش دیجیتالی از یک چیز واقعی است. توکنایز کردن، میتواند برای محافظت از دادههای حساس یا پردازش موثر مقادیر زیادی از دیتاها استفاده شود. مفهوم توکنایز کردن فقط مختص به ارزهای دیجیتال و بازارهای مالی نیست! بلکه در زمینههای دیگر مانند هوش مصنوعی، تعاریف متفاوتی به خود میگیرد.
مقدمه
رویدادهای چند سال گذشته به وضوح نشان میدهد که ما با سرعت فزایندهای به سمت عصر بعدی اینترنت میرویم. چندین نوآوری جدید در زمینهی تکنولوژی این ادعا را تایید میکنند. هوش مصنوعی مولد (Generative AI) یکی از موارد است. Web3 یک اینترنت جدید و غیرمتمرکز را ارائه میدهد که توسط شرکتکنندگان و از طریق بلاکچین کنترل میشود، نه تعداد انگشت شماری از شرکتهای متمرکز! روشهای پرداخت در جهان نیز رو به تغییر است. در سال ۲۰۲۱ از هر دو مصرفکننده، یک نفر از یک محصول فینتک، عمدتاً از پلتفرمهای پرداخت همتا به همتا و انتقال پول غیربانکی استفاده میکرد.
این مطلب مرتبط را هم مطالعه نمایید: توکن (Token) چیست؟
هوش مصنوعی مولد، وب۳ و فینتک چه ویژگیهای مشترکی دارند؟
همهی آنها به فرآیندی به نام توکن سازی متکی هستند. اما هر یک، از توکن سازی به روشی بسیار متفاوت استفاده میکند.
برای پرداختها، توکن سازی برای امنیت سایبری، مخفی کردن هویت پرداخت و جلوگیری از تقلب استفاده میشود. در Web3، توکنسازی یک فرآیند دیجیتالی سازی برای دسترسی بیشتر به داراییها است. درمورد هوش مصنوعی، مسئله کاملاً چیز دیگری است: توکن سازی برای تجزیهی دادهها یا تشخیص آسانتر الگو استفاده میشود.
بعداً در این مقاله، نمونههای خاصی از نحوهی متفاوت عملکرد توکن سازی در هر زمینه را بررسی خواهیم کرد. اول، بیایید اصول اولیه را بررسی کنیم.
توکن سازی چگونه کار میکند؟
به طور کلی، توکن سازی فرآیند صدور یک نمایش دیجیتال، منحصر به فرد و ناشناس از یک چیز واقعی است. در برنامههای کاربردی Web3، توکن در یک بلاکچین استفاده میشود. این به توکن اجازه میدهد تا در پروتکلهای خاص استفاده شود. توکنها میتوانند داراییهایی از جمله داراییهای فیزیکی مانند املاک یا آثار هنری، داراییهای مالی مانند سهام یا اوراق قرضه، داراییهای نامشهود مانند مالکیت معنوی یا حتی هویت و اطلاعات را نشان دهند.
در برنامههای کاربردی هوش مصنوعی، توکنسازی به روشی متفاوت عمل میکند. این برنامهها مدلهای زبان بزرگ (Large Language Models)(LLM) را فعال میکنند. که از تکنیکهای یادگیری عمیق (Deep Learning) برای پردازش، طبقهبندی و پیوند دادن قطعات اطلاعات – از جملات کامل گرفته تا کاراکترهای تکی – استفاده میکنند. توکنسازی پرداخت، با تولید یک کد موقت به جای دادههای اصلی، از دادههای حساس محافظت میکند.
توکن سازی میتواند چندین نوع توکن ایجاد کند. در صنعت خدمات مالی، یک مثال میتوان به استیبل کوینها اشاره کرد. نوعی از ارزهای دیجیتال که با پولهای دنیای واقعی متصل شدهاند تا قابل تعویض یا تکرار باشند.
نوع دیگری از توکن، NFT است. یک توکن غیرقابل تعویض، به معنای توکنی که قابل تکرار نیست. انافتی اثبات دیجیتالی مالکیتی است که افراد میتوانند بخرند و بفروشند.
مثال دیگر می تواند به سادگیِ کلمهی «گربه» باشد. یک LLM کلمه “cat” را توکنایز میکند و از آن برای درک روابط بین “cat” و سایر کلمات استفاده مینماید.
در ادامه، نحوه عملکرد توکن سازی و معنای آن برای آینده را بررسی خواهیم کرد.
توکن سازی در مدلهای زبان بزرگ چگونه کار میکند؟
قبل از پاسخ به این سوال، اجازه دهید برخی از اصول اولیه را بررسی کنیم. مدلهای یادگیری عمیق که بر روی مقادیر زیادی از دادههای بدون ساختار و بدون برچسب آموزش میبینند، مدلهای پایه نامیده میشوند. LLMها مدلهای پایهای هستند که بر روی متن آموزش میبینند. این مدلها که از طریق فرآیندی به نام تنظیم دقیق (Fine-Tuning) آموزش داده میشوند، نه تنها میتوانند مقادیر انبوهی از متن بدون ساختار را پردازش کنند، بلکه میتوانند روابط بین جملات، کلمات یا حتی بخشهایی از کلمات را نیز بیاموزند. این به نوبهی خود، آنها را قادر میسازد تا متن زبان طبیعی را تولید کنند! یا اینکه خلاصه سازی یا سایر وظایف استخراج دانش را انجام دهند.
در اینجا توضیح میدهیم که چگونه توکن سازی این امکان را فراهم میکند. هنگامی که یک LLM، روی یک متن، اعمال میشود، متن را به تعدادی توکن تقسیم میکند. به هر توکن یک شناسهی عددی منحصر به فرد اختصاص داده میشود. سپس برای پردازش، به LLM باز میگردند. مدل، روابط بین توکنها را یاد میگیرد و بر اساس الگوهایی که یاد میگیرد، پاسخهایی تولید میکند.
تعدادی از تکنیکهای توکن سازی وجود دارد که معمولاً در LLM استفاده میشود:
توکن سازی کلمه (Word tokenization):
متن را به کلمات جداگانه یا واحدهای کلمه مانند تقسیم میکند و هر کلمه به یک توکن جداگانه تبدیل میشود. توکنایز کردنِ کلمات ممکن است با کلمات مرکب یا اختصاری به مشکل بر بخورد.
توکن سازی کاراکتر (Character tokenization):
هر کاراکتر در متن را یک توکن جداگانه میکند. این روش برای تشخیص دستخط یا هنگام برخورد با زبانهایی که مرزهای کلمات واضحی ندارند، به خوبی کار میکند.
توکن سازی زیرکلمهها (Subword tokenization):
کلماتی که کمتر استفاده میشوند را به واحدهایی از دنبالههای متداول کاراکترها تقسیم میکند. توکنهای زیرکلمه بزرگتر از کاراکترهای تکی هستند اما کوچکتر از کل کلمات هستند. با شکستن کلمات به توکنهای زیرکلمه، یک مدل بهتر، میتواند کلماتی را که در دادههای آموزشی وجود نداشتند مدیریت کند. رمزگذاری جفت بایت (Byte pair encoding)(BPE) یک الگوریتمِ رمزگذاری زیرکلمه است. BPE با واژگانی از کاراکترها یا کلمات شروع میشود و توکنهایی که اغلب با هم ظاهر میشوند را ادغام میکند.
توکن سازی صرفی (Morphological tokenization):
این مورد، از تکواژها استفاده میکند. تکواژها، واژهها یا بخشهایی از کلمات هستند که معانی یا عملکردهای دستوری خاصی دارند. به عنوان مثال، کلمهی «ناراحتم» را میتوان به سه تکواژ تقسیم کرد: ۱. نا (پیشوندی که منفی ساز است)، ۲. راحت (ریشه) و ۳. ـَم (تکواژ تصریفی شناسهی فعل). در توکنایز کردن صرفی، هر تکواژ به یک توکن تبدیل میشود که به LLMها امکان میدهد تا تغییرات کلمه را مدیریت کنند، ساختارهای دستوری را درک کنند و در نهایت متن دقیق زبانی تولید نمایند.
نوع توکن سازی مورد استفاده بستگی به آنچه مدل باید انجام دهد، دارد. روشهای مختلف توکن سازی نیز ممکن است برای دستیابی به نتایج مورد نیاز ترکیب شوند.
چه فناوریهایی Web3 را میسازند؟
همانطور که میدانیم، Web3 نوع جدیدی از اینترنت است که بر اساس انواع جدیدی از تکنولوژی ساخته شده است. در اینجا سه نوع اصلی وجود دارد:
بلاکچین (Blockchain)
بلاکچین یک فضای توزیع شده دیجیتال و غیرمتمرکز است که در سراسر شبکهی کامپیوتری وجود دارد و ثبت تراکنشها را تسهیل میکند. وقتی که دادههای جدید به یک شبکه اضافه میشود، یک بلاک جدید ایجاد میگردد و به طور دائم در زنجیرهی اطلاعات باقی میماند. سپس تمام گرههای (Nodes)(یا همان بلاکهای) روی بلاکچین بهروزرسانی میشوند تا تغییر را منعکس کنند. این بدان معنی است که سیستم تحت تاثیر یک مرکز کنترل یا نقص قرار نمیگیرد.
قراردادهای هوشمند (Smart contracts)
این قراردادها، برنامههای نرمافزاری هستند که بهطور خودکار در صورت برآورده شدن شرایط مشخص، اجرا میشوند. مثل شرایط توافق شده توسط خریدار و فروشنده! قراردادهای هوشمند به صورت کد روی یک بلاکچین ایجاد میشوند که قابل تغییر نیستند.
داراییها و توکنهای دیجیتال (Digital assets and tokens)
اینها موارد ارزشمندی هستند که فقط به صورت دیجیتالی وجود دارند. میتوانند شامل ارزهای دیجیتال، استیبل کوینها، ارزهای دیجیتال بانک مرکزی (CBDC) و NFT باشند. آنها همچنین میتوانند شامل نسخههای توکن شدهی داراییها، از جمله چیزهای واقعی مانند بلیطهای هنری یا کنسرت باشند.
همانطور که خواهیم دید، این فناوریها برای پشتیبانی از انواع پیشرفتهای مرتبط با توکنسازی گرد هم میآیند.
مزایای بالقوه توکن سازی برای ارائه دهندگان خدمات مالی چیست؟
برخی از رهبران صنعت بر این باورند که توکنسازی میتواند ساختار خدمات مالی و بازارهای سرمایه را متحول کند، زیرا به دارندگان دارایی اجازه میدهد از مزایای بلاکچین، مانند عملیات ۲۴ ساعته و در دسترس بودن دادهها بهره ببرند. بلاکچین همچنین تسویهی سریعتر تراکنشها و درجهی بالاتری از اتوماسیون را ارائه میدهد. (از طریق کد تعبیه شده که فقط در صورت رعایت شرایط خاص، فعال میشود.)
در حالی که هنوز در مقیاس بزرگ آزمایش نشده است، مزایای بالقوه توکن سازی شامل موارد زیر است:
تسویهی سریعتر تراکنش
با در دسترس بودن ۲۴ ساعته! در حال حاضر، اکثر تسویه حسابهای مالی دو روز کاری پس از انجام معامله انجام میشوند. (قانون T+2! در تئوری، به این منظور است که به هر یک از طرفین زمان بدهند تا اسناد و وجوه خود را مرتب کنند.) تسویههای فوری که با توکنسازی ممکن میشود، میتواند به صرفهجویی قابل توجهی، برای شرکتهای مالی، در محیطهای با نرخ بهره بالا، تبدیل شود.
صرفه جویی در هزینهی عملیاتی
با در دسترس بودن ۲۴ ساعتهی اطلاعات و قابلیت برنامهریزی دارایی، این مورد ممکن میشود. این به ویژه برای طبقات دارایی مفید است که در آن خدمات یا انتشار به شدت دستی (غیر سیستمی) و در نتیجه مستعد خطا است. مانند اوراق قرضه شرکتی. تعبیه عملیاتی مانند محاسبهی بهره و پرداخت کوپن در قرارداد هوشمند توکن، این عملکردها را خودکار میکند و به تلاش انسانی کمتری نیاز دارد.
دموکراتیک کردن دسترسی
با ساده سازی فرآیندهای عملیاتی دستی، خدماترسانی به سرمایهگذاران کوچکتر میتواند به یک پیشنهاد اقتصادی و جذاب، برای ارائهدهندگان خدمات مالی تبدیل شود. البته، قبل از تحقق دموکراتیک کردن واقعی دسترسی، توزیع دارایی توکن شده باید به طور قابل توجهی مقیاس شود.
افزایش شفافیت
این مورد توسط قراردادهای هوشمند انجام میشود. قراردادهای هوشمند مجموعهای از دستورالعملها هستند که به صورت توکنهای کدگذاری شدهاند که بر روی یک بلاکچین صادر میشوند و میتوانند تحت شرایط خاص اجرا شوند. یک مثال میتواند قرارداد هوشمند برای اعتبارهای Carbon باشد، که در آن بلاکچین میتواند یک رکورد غیرقابل تغییر و شفاف از اعتبارات، حتی زمانی که آنها معامله میشوند، ارائه دهد.
زیرساختهای ارزانتر و هوشمندتر
بلاکچینها منبع باز هستند، بنابراین ذاتاً ارزانتر و آسانتر از زیرساختهای خدمات مالی سنتی پیادهسازی میشوند.
از زمان معرفی توکنسازی داراییهای دیجیتال در سال ۲۰۱۷، سالهاست که در مورد آن هیاهو وجود داشته است. اما علیرغم پیشبینیهای بزرگ، هنوز به روشی معنادار عمل نکرده است. با این حال، ما شاهد حرکت آهستهای هستیم: شرکت زیرساختهای فین تک مستقر در آمریکا، Broadridge، اکنون ماهانه بیش از ۱ تریلیون دلار قراردادهای بازخرید توکن شده را در پلتفرم خود (Distributed Ledger Repo (DLR))، به جریان میاندازد.
چگونه یک دارایی وب۳ توکنیزه میشود؟
چهار مرحله معمولی در توکن سازی دارایی وجود دارد:
۱. منابع دارایی
اولین مرحله توکن سازی، کشف نحوهی توکن کردن دارایی مورد نظر است. به عنوان مثال، توکن کردن یک صندوق بازار پول با توکن کردن اعتبار کربن متفاوت است. این فرآیند مستلزم دانستن اینکه آیا دارایی به عنوان یک اوراق بهادار یا کالا در نظر گرفته میشود و چه چارچوبهای نظارتی اعمال میشود، نیاز دارد.
۲. صدور و نگهداری دارایی دیجیتال
اگر دارایی دیجیتال، یک همتای فیزیکی داشته باشد، باید به یک مرکز امن منتقل شود که برای هر دو طرف خنثی باشد. سپس یک توکن، یک شبکه، و توابع انطباق انتخاب میشوند. برای ایجاد یک نمایش دیجیتالی از دارایی در یک بلاکچین. سپس دسترسی به دارایی دیجیتال در انتظار توزیع ذخیره میشود.
۳. توزیع و معامله
سرمایهگذار باید یک کیف پول دیجیتال، برای ذخیرهی دارایی دیجیتال، راه اندازی کند. بسته به دارایی، ممکن است یک محل معاملاتی ثانویه برای دارایی ایجاد شود.
۴. خدمات دارایی و تطبیق دادهها
هنگامی که دارایی بین سرمایهگذاران توزیع شد، نیاز به نگهداری مداوم دارد. این باید شامل گزارشات نظارتی، مالیاتی و حسابداری باشد. اطلاع از اقدامات شرکت؛ و بیشتر.
آیا در نهایت زمان مناسب برای توکن سازی رسیده است؟
شاید. عوامل خدمات مالی در حال حاضر شروع به توکن کردن پول نقد کردهاند. در حال حاضر، تقریباً ۱۲۰ میلیارد دلار پول نقد توکن شده به شکل استیبل کوینهای کاملاً ذخیره شده در گردش است. همانطور که در بالا ذکر شد، استیبل کوینها نوعی ارز دیجیتال هستند که با یک ارز فیزیکی (یا کالا یا ابزار مالی دیگر) با هدف حفظ ارزش در طول زمان متصل میشوند.
با این اوصاف، چند دلیل وجود دارد که توکنسازی ممکن است راه بیفتد. نرخهای بهره بالاتر در چرخه فعلی، بر خلاف تصور اکثریت، باعث بهبود وضعیت اقتصادی برخی موارد استفاده از توکنسازی، بهویژه مواردی که با نقدینگی کوتاهمدت سروکار دارند، میشود. (زمانی که نرخ بهره بالا باشد، تفاوت بین تراکنش یک ساعته و ۲۴ ساعته میتواند برابر با مقدار زیادی پول باشد.)
علاوه بر این، از پنج سال پیش که توکنسازی آغاز شد، بسیاری از شرکتهای خدمات مالی به طور قابل توجهی تیمها و قابلیتهای دارایی دیجیتال خود را افزایش دادند. این تیمها بیشتر در حال آزمایش هستند و به طور مستمر تواناییهای خود را گسترش میدهند. همانطور که تیمهای دارایی دیجیتال بالغ میشوند، ممکن است شاهد استفاده فزاینده توکن سازی در تراکنش های مالی باشیم.
توکن سازی در ایران
صحبتهای توکنسازی در کشور ما نیز، در میان افراد علاقمند، وجود داشته است.
قائم مقام مدیر یکی از شرکتهای دانش بنیان در ایران گفت که «عرضهی توکن، مبتنی بر توکنسازی داراییها، نه تنها منجر به ایجاد تورم نمیشود، بلکه میتواند جذبکننده تورم و تسهیل مدیریت جریان نقدینگی در کشور باشد.»
«اکنون با پیشرفت علم و توسعه اینترنت و فضای مجازی، توکن سازی داراییها وارد عرصه جدیدی شد. اکنون دیگر ما با تغییراتی هستی شناسانه در مفهوم توکن مواجهیم، دیگر توکن در شمایل فیزیکی نیست، بلکه توکنها در دریای مواج اینترنت شناورند. با توسعه اینترنت و پیدایش شبکهها توزیع شده، ما به مفهومی نوین تحت عنوان فنّاوری دفتر کل توزیع شده میرسیم.»