در SQL، هر ستون در یک جدول پایگاه داده برای نگهداری نوع مشخصی از داده طراحی شده است. انواع داده در SQL قوانینی هستند که مشخص میکنند چه نوع مقدارهایی میتوانند در یک ستون ذخیره شوند. برای مثال، اگر ستونی برای سن کاربر دارید، نوع داده آن را به INT تنظیم میکنید تا تنها اعداد صحیح ذخیره شوند. انتخاب نوع داده درست برای حفظ یکپارچگی داده، بهینهسازی ذخیرهسازی و عملکرد پایگاه داده ضروری است.
انواع داده در SQL را میتوان عموماً به دستههای زیر تقسیم کرد:
- اعدادی
- تاریخ و زمان
- رشتهای و کاراکتری
- باینری
- تخصصی (مثل JSON، جغرافیا، UUID و …)
در حالی که بسیاری از انواع داده استاندارد شدهاند، نامها و رفتار آنها ممکن است بین سامانههای مختلف پایگاه داده مانند MySQL، PostgreSQL و SQL Server کمی متفاوت باشد. در این راهنما، همه چیزهایی را که نیاز دارید برای انتخاب و استفاده از انواع داده مناسب بدانید، خواهید آموخت.
انتخاب نوع داده مناسب تنها یک صورتبندی فنی نیست؛ پیامدهای واقعی برای کاربرد شما دارد.
اگرچه انواع دادهی SQL که در این راهنما پوشش داده شدهاند بهطور گسترده استفاده میشوند، مهم است به خاطر داشته باشید که پیادهسازی آنها ممکن است در هر سامانه پایگاه داده متفاوت باشد. قبل از نهایی کردن اسکیمای پایگاه داده خود، همواره این تفاوتهای کلیدی را در نظر بگیرید.
به دلیل این تفاوتها، بهترین کار این است که همیشه مستندات رسمی ارائهدهنده پایگاه دادهتان را مشورت کنید تا اطمینان حاصل کنید انواع دادهای که انتخاب میکنید بهطور کامل پشتیبانی شده و برای سناریوی شما بهینه هستند. حتماً نوع داده مناسب را برای سناریوی خود انتخاب کنید.
انواع داده عددی
انواع داده عددی برای هر دادهای که شامل اعداد است استفاده میشوند. آنها به چند دسته تقسیم میشوند، از جمله انواع دقیق برای اعداد صحیح (integers) و اعداد اعشاری (decimals)، و انواع تقریبی برای محاسبات علمی که در آنها دقت مطلق هدف اصلی نیست (floating-point).
در اینجا یک جدول جامع از شایعترین انواع داده عددی SQL، شامل اندازه ذخیرهسازی و محدوده مقادیر، آورده شده است.
تاریخ و زمان
ذخیره درست تاریخ و زمان برای ثبت وقایع، زمانبندی و ردیابی رویدادها حیاتی است. تفاوت کلیدی در دامنه اطلاعات است. از DATE برای مقادیری مانند تاریخ تولد که زمان روز اهمیت ندارد استفاده کنید. از DATETIME یا TIMESTAMP زمانی استفاده کنید که لازم است لحظه دقیق وقوع یک رویداد را ثبت کنید، مثلاً وقتی کاربری وارد سیستم میشود یا سفارشی ثبت میشود.
انواع داده رشتهای
انواع داده رشتهای برای ذخیره تمام انواع داده متنی استفاده میشوند، از یک حرف تا اسناد کامل. تصمیم رایج بین انواع با طول ثابت (که همیشه فضای یکسانی اشغال میکنند) و انواع با طول متغیر (که با اندازه داده سازگار میشوند) است. ملاحظه حیاتی دیگر این است که آیا نیاز به پشتیبانی از کاراکترهای بینالمللی با استفاده از انواع یونیکد دارید یا خیر.
این جدول نمای کلی از متداولترین انواع کاراکتری و رشتهای را ارائه میدهد.
نکته: MySQL یونیکد را بهصورت متفاوتی مدیریت میکند. از NCHAR, NVARCHAR, NTEXT استفاده نمیشود. در عوض از نوع استاندارد VARCHAR یا TEXT استفاده کرده و مجموعه کاراکتر ستون را به یک مجموعه کاراکتر سازگار با یونیکد مثل utf8mb4 تنظیم میکنید. برای مثال:
username VARCHAR(100) CHARACTER SET utf8mb4.انواع داده باینری
انواع داده باینری برای ذخیره دادههای خام باینری، مثل فایلها، بهجای متن خوانا توسط انسان استفاده میشوند. این انواع زمانی ضروریاند که نیاز به ذخیره تصاویر، کلیپهای صوتی یا کدهای کامپایلشده بهصورت مستقیم در پایگاه داده داشته باشید.
نکته: در حالی که ذخیره تصاویر یا فایلهای کوچک در یک BLOB میتواند راحت باشد، برای برنامههای با ترافیک بالا یا فایلهای بزرگ، معمولاً بهتر است فایلها را در یک فایلسیستم اختصاصی یا سرویس ذخیرهسازی اشیاء، ذخیره کرده و تنها آدرس یا مسیر فایل را در پایگاه داده نگهداری کنید.
انواع داده تخصصی
امروزه پایگاههای داده SQL انواع داده تخصصی متنوعی برای مدیریت ساختارهای داده مدرن مانند JSON، دادههای جغرافیایی یا مقادیر بولی ارائه میدهند.
تفاوتهای بین پیادهسازیهای مختلف پایگاه داده
در حالی که انواع داده پایه مانند INT و VARCHAR بهطور گسترده پشتیبانی میشوند، هر سامانه بزرگ پایگاه داده طعم خاص خود را دارد و انواع داده اختصاصی یا رفتارهای متفاوتی برای انواع استاندارد ارائه میدهد. آشنایی با این تفاوتها برای نوشتن کد SQL قابل حمل و کارا ضروری است.
MySQL
MySQL بهخاطر سادگی استفاده شناخته شده و برخی ویژگیهای غیراستاندارد اما راحت را ارائه میدهد.
PostgreSQL
PostgreSQL مشهور به پیروی دقیق از استاندارد SQL و مجموعه غنیای از انواع داده پیچیده است.
SQL Server
محصول مایکروسافت مجموعهای جامع از انواع را با تمرکز بر اکوسیستم خود ارائه میدهد.
Oracle
پایگاه داده Oracle سابقه طولانی دارد و برخی پیادهسازیهای اختصاصی انواع داده را داراست که توسعهدهندگان باید از آنها آگاه باشند.
تبدیل نوع (Type Casting)
تبدیل نوع یا تبدیل داده فرایند تبدیل مقدار از یک نوع داده به نوع دیگر است. این کار هنگام مقایسه انواع مختلف در یک پرسوجو، قالببندی داده برای نمایش یا انجام محاسبات روی دادهای که ممکن است بهصورت متن ذخیره شده باشد، اغلب ضروری است.
دو نوع تبدیل وجود دارد: ضمنی (خودکار) و صریح (دستی).
تبدیل ضمنی: زمانی است که پایگاه داده بهصورت خودکار نوع داده را پشت صحنه برای شما تبدیل میکند. برای مثال در پرسوجوی WHERE my_integer_column = '123' پایگاه داده رشته ‘123’ را به عدد صحیح تبدیل میکند تا مقایسه انجام شود. اگرچه مفید است، تکیه بر تبدیل ضمنی اغلب عمل بدی در نظر گرفته میشود چون میتواند به نتایج غیرمنتظره یا مشکلات عملکردی منجر شود.
تبدیل صریح: زمانی است که شما بهصورت دستی از یک تابع برای تبدیل نوع داده استفاده میکنید. این رویکرد توصیهشده است چون نیت کد شما را دقیقاً روشن میکند و تبدیل قابلپیشبینی و قابلاطمینان است. دو تابع اصلی برای این کار CAST() و CONVERT() هستند:
CAST(): تابع CAST() استاندارد ANSI SQL است که در تقریباً همه سامانههای پایگاه داده از جمله MySQL، PostgreSQL و SQL Server در دسترس است. این تابع بیشترین قابلیت حمل را دارد. سینتکس بهصورت:
«The syntax is:»
CONVERT(): تابع CONVERT() عمدتاً در SQL Server استفاده میشود و نسبت به CAST() انعطافپذیری بیشتری دارد، بهویژه برای قالببندی تاریخ و زمان. سینتکس بهصورت:
«The syntax is:»
کد سبک اختیاری style_code عددی است که فرمت خروجی را برای تبدیلهای تاریخ/زمان یا تبدیل عدد به رشته مشخص میکند.
بهینهسازی اندازه و عملکرد
در طراحی پایگاه داده، معمولاً کوچکتر بودن بهتر است. اگرچه فضای ذخیرهسازی امروزه نسبتاً ارزان است، اندازه انواع داده تأثیر عمیقی فراتر از فضای دیسک دارد. این اندازه بهطور مستقیم روی سرعت پرسوجوها، استفاده حافظه و کلی عملکرد برنامه اثر میگذارد. در اینجا چرا و چگونه اندازه مناسب را انتخاب کنید آمده است.
این اصلیترین قاعده است: اگر TINYINT کافی است، از پیشفرض INT استفاده نکنید.
قبل از انتخاب نوع، دامنه داده را بفهمید. سوالاتی بپرسید: آیا این عدد میتواند منفی شود؟ اگر نه، در MySQL به UNSIGNED فکر کنید. آیا بخش اعشاری دارد؟ سپس به DECIMAL نیاز دارید. طول حداکثر یک SKU محصول چقدر میتواند باشد؟ برای مثال، کد پستی ایالات متحده را در نظر بگیرید. وسوسهکننده است که از INT برای کد پستی استفاده کنید، اما این یک اشتباه کلاسیک است. کد پستی میتواند صفرهای پیشرو داشته باشد (مثلاً 07660) که در صورت ذخیره بهصورت عدد از بین میروند. نوع صحیح CHAR(5) است که فرمت را حفظ کرده و فضای پیشبینیشدهای مصرف میکند.
برنامهریزی برای رشد عاقلانه است، اما بیشمهندسی نکنید.
گروهبندی انواع داده
انواع داده SQL را میتوان بر اساس نوع دادهای که ذخیره میکنند به دستههای منطقی تقسیم کرد. دستههای اصلی عبارتاند از:
- عددی
- رشتهای / کاراکتری
- تاریخ و زمان
- باینری
- تخصصی (JSON، جغرافیا، UUID، بولی و …)
تفاوت بین انواع با طول مشخص و انواع با طول متغیر به سه حوزه کلیدی برمیگردد: طول مشخصشده، ذخیرهسازی و مورد استفاده موردنظر.
تفاوت بین سیستمهای پایگاه داده محبوب
در حالی که هر دو سامانه پایگاه داده از انواع استاندارد پشتیبانی میکنند، هر کدام ویژگیها و افزونههای منحصر بهفردی ارائه میدهند که نیازهای متفاوتی را پوشش میدهد.
در تقریباً تمام پایگاههای داده مدرن (از جمله MySQL، PostgreSQL و SQL Server)، نوع INT یا INTEGER یک عدد صحیح 4 بایتی (32 بیتی) است.
جمعبندی
این مقاله یک مرور کامل از انواع داده در SQL ارائه داد، با شروع از تأثیر بنیادی آنها بر عملکرد، یکپارچگی و ذخیرهسازی. ما هر دسته اصلی را به تفصیل پوشش دادیم، از انواع عددی و رشتهای گرفته تا انواع تخصصی مثل JSON و UUID. همچنین تفاوتها و ویژگیهای منحصربهفرد در سراسر سیستمهای محبوب پایگاه داده از جمله MySQL، PostgreSQL، SQL Server و Oracle را بررسی کردیم. برای تکمیل درک شما، مهارتهای پیشرفتهای مانند تبدیل نوع با CAST() و بهترین شیوههای بهینهسازی ذخیرهسازی را نیز بررسی کردیم تا پایهای جامع و عملی در اختیار شما قرار دهیم.
درک انواع داده گامی بزرگ در تسلط بر SQL است.
از یادگیری با جامعه پارمین کلود متشکریم.




نظرات کاربران