ماژول مانیتورینگ یک ابزار یا سیستم نرمافزاری است که برای مانیتور کردن و نظارت بر عملکرد یک سیستم یا شبکه استفاده میشود. این ماژولها معمولاً اطلاعاتی را دربارهی وضعیت و عملکرد سیستم یا شبکه به کاربر ارائه میدهند تا او بتواند به مشکلات و ایرادات سریعاً پاسخ دهد.
کاربری ماژول مانیتورینگ شامل موارد زیر میشود:
- نظارت بر وضعیت سرورها، شبکهها، دیتابیسها و سایر اجزای سیستم.
- ثبت و نمایش آمارها و معیارهای عملکرد سیستم.
- اعلانها و هشدارها در صورت وقوع خطا یا مشکلات در عملکرد.
- ذخیره و نگهداری دادههای مانیتورینگ برای تجزیه و تحلیل بعدی.
با استفاده از ماژول مانیتورینگ، کاربران میتوانند بهبود عملکرد و بهینهسازی سیستمهای خود را انجام دهند و از ایرادات و مشکلات بهصورت سریع پاسخگو باشند. در ادامه این مطلب با شرکت دانش بنیان پلتکو همراه باشید تا مستندات کاملی را جهت استفاده کاربری ماژول مانیتورینگ پلتفرم پلتکو ارائه دهیم.
1. مقدمه
این مستند به عنوان راهنمای استفاده از نرم افزار Zabbix برای پایش سیستم پلتکو تهیه شده است و جزییات مربوط به آن را شرح می دهد.
ماژول مانیتورینگ پلتکو برای پایش منابع (شاملCPU ، RAM و Storage ، کارت شبکه و غیره) ماشین ها و خدمات(خدمات سرویس دهندگان مختلف و خدمات واسط) راه اندازی شده است. پایش سیستم با استفاده از نرمافزار متن بازzabbix نسخه ۶.۲ با لایسنس GPL که در ادامه به شرح بخشهای مهم آن پرداخته شده ، انجام می شود:
برای راه اندازی ماژول مانیتورینگ بایستی بسته های نرم افزاری زیر بر روی سرور میزبان نرم افزار زبیکس نصب شود:
- بسته postgres-server به عنوان پایگاه داده سرور زبیکس مورد استفاده قرار میگیرد.
- بسته zabbix-server-psql برای نصب و راهاندازی سرور زبیکس مورد استفاده قرار میگیرد. این بسته وظیفه فراخوانی سرویسها و جمعآوری اطلاعات از هاستهای زیرساخت را برعهده دارد.
- پکیج zabbix-web-nginx-pgsql برای راهاندازی پنل تحت وب زبیکس مورد استفاده قرار میگیرد. همچنین این پکیج وظیفه راهاندازی یک وبسروری برای اجرای زبیکس را نیز بر عهده دارد.
- پکیج zabbix-agent برای راهاندازی agent زبیکس بر روی ماشین های هدف مانیتورینگ مورد استفاده قرار میگیرد. این پکیج وظیفه جمعآوری اطلاعات از روی هاست های هدف و انتقال آن به زبیکس سرور را دارد.
از جمله مواردی که توسط ماژول مانیتورینگ، پایش میشوند عبارتند از: منابع (شاملCPU ، RAM و Storage) ، سلامت ماژول های نرم افزاری پلتفرم (مانند kafka ، psql و …)، پورتها، و سرویس Health-Check مربوط به دسته های مختلف سرویس ها.
علاوه بر اینها میتوان امکان پایش ارتباط و خدمات سرویس دهندگان ثالث بیرونی را نیز اضافه نمود اما پایش خدمات فقط برای سرویس هایی که ماهیت دریافت اطلاعات را دارند امکان پذیر است نه برای سرویس هایی که تغییراتی را در جایی اعمال می کنند.
2. صفحه ورود
با وارد کردن آدرس سرویس Zabbix صفحه ورود به سیستم را مشاهده خواهید نمود:
با وارد کردن اطلاعات کاربری خود (نام کاربری/رمز عبور) وارد سامانه شوید.
3 – داشبورد WSO2
بعد از ورود به سامانه مدیریت مانیتورینگ به داشبورد WSO2 منتقل میشوید. همچنین میتوانید مانند تصویر زیر از منوی سمت چپ، به این داشبورد دسترسی داشته باشید:
با ورود به داشبورد در بالای سمت راست داشبورد میتوانید از فیلتر بازه زمانی استفاده کنید و وضعیتهای مربوط به روز جاری یا ۱۵ دقیقه اخیر را مشاهده کنید:
همانگونه که در تصویر زیر مشاهده میکنید این داشبورد از صفحات مختلفی تشکیل شده است که در هر صفحه اطلاعات متفاوتی از وضعیت سامانهها، سرویسها و … نمایش داده میشود.
در ادامه به شرح هر یک از این صفحات میپردازیم:
صفحه Overview:
صفحه overview خلاصهای از وضعیتها و مشکلات را نشان میدهد و از بخشهای مهم آن میتوان به موارد زیر اشاره کرد:
- Top hosts by CPU utilization: اطلاعات منابع (حافظه، دیسک و پردازنده) تمام سرورهای Worker، Master و Storage را به صورت خلاصه نمایش میدهد.
- Current problems: اطلاعاتی از آخرین مشکلات رخ داده را نمایش میدهد. در این بخش سطح، شرح و زمان این مشکلات قابل مشاهده است.
- System information: اطلاعات کلی سرور زبیکس را نمایش میدهد.
- Action Log: در این بخش اقدامات و اطلاعرسانیهای انجام شده توسط زبیکس قابل مشاهده است. برای مثال در حالتی که یکی از Endpointها از دسترس خارج شود، رخدادی در سطح High رخ میدهد اطلاعرسانیهای مرتبط با آن در این بخش قابل مشاهده است. در این نمایش، نوع پیام، محتوای پیام، گیرنده و زمان ارسال قابل مشاهده است.
صفحه Endpoint Status:
صفحه Endpoint Status آخرین وضعیت Endpointها و همچنین سامانههای داخلی نظیر ELK و AM را نشان میدهد و شامل نمودارهای زیر است. لازم به ذکر است که Endpointها و سامانهها در بازههای زمانی کوتاه، با درخواستهای API مورد بررسی قرار میگیرند.
- Connecting Issue in Servers: در صورتی که درخواستهای API بدون پاسخ بماند خطای آن در این نمودار قابل مشاهده است.
- Server Status Codes: کد وضعیت درخواستهای ارسالی به Endpointها و سامانههای سرویس دهنده را نمایش میدهد.
لازم به ذکر است که کدهای ارسالی مورد انتظار برای هر Endpoint یا سامانه سرویس دهنده متفاوت است.
صفحه API Status:
در این صفحه آخرین وضعیت هر کدام از سرویسهای مورد استفاده توسط کاربران قابل مشاهده است
کد وضعیت ۵۰۰ برای سرویسها به منزله خطای درون سامانهای تشخیص داده میشود و در صورت رخداد به افراد مرتبط اطلاعرسانی انجام میگیرد.
صفحه Server Resource:
این صفحه وضعیت و تاریخچه منابع (ترافیک، حافظه، پردازشگر و دیسک) مورد استفاده سرورها را نشان میدهد:
صفحه Server Health:
این صفحه تاریخچه وضعیت زبیکس و ماژولهای آن را نشان میدهد:
4. نحوه مانیتورینگ سرویسها و سطوح Problemها
نحوه سرویس مانیتورینگ در سامانه پلتکو به طور کلی در موارد زیر خلاصه میشوند:
– منابع سرور مانند حافظه، دیسک، پردازشگر و واسط شبکه: با توجه به تریگرهایی تعریف شده در صورتی که هر یک از منابع سرور در حد بحرانی قرار گیرد، یک Problem با سطح Average ایجاد میشود.
این موارد به صورت زیر دقیق میشوند:
- 0 فضای خالی دیسک کمتر از ۱۰ درصد باشد
- 0 فضای خالی حافظه تصادفی کمتر از ۱۰ درصد باشد
- 0 بار پردازشگر بیشتر از یک باشد
- 0 یکی از واسطهای شبکه از دسترس خارج شود
– Connection بر روی Endpointها: در هر 15 ثانیه یک درخواست https به هر یک از Endpointها ارسال میشود و در صورتی که از ده درخواست حداقل ۵ خطا دیده شود یک Problem با سطح High ایجاد میشود.
– نظارت کد خطاهای Endpoint ها: در هر 15 ثانیه یک درخواست https به هر یک از Endpointها ارسال میشود و در صورتی که از ده درخواست حداقل ۵ کد خطا یکسان دیده شود یک Problem با سطح High ایجاد میشود.
– Health-Check بر روی سرویسهای اصلی سامانه مانند AM و PI: در هر 15 ثانیه یک درخواست https به هر یک از سرویسها ارسال میشود و در صورتی که از ده درخواست حداقل ۵ خطا دیده شود یک Problem با سطح Disaster ایجاد میشود.
– Health-Check بر روی سرویسهای ثانویه سامانه مانند ELK: در هر 15 ثانیه یک درخواست https به هر یک از سرویسها ارسال میشود و در صورتی که از ده درخواست حداقل ۵ خطا دیده شود یک Problem با سطح High ایجاد میشود.
برای هر یک از موارد فوق اطلاعرسانی به اپراتورها از طریق پیامک صورت میگیرد. همچنین نظارتهای دیگری وجود دارد که در سطح پایین تر از Average قرار میگیرد و در این بخش نیامدهاند. این موارد در صورت بروز، فقط در داشبورد و در بخش Problems آن قابل مشاهده هستند.
5 – افزودن قابلیت مانیتورینگ سرویس ها به Zabbix
برای افزودن امکان مانیتورینگ یک سرویس نوعی ، فرایند زیر طی میشود:
در ابتدا لازم است از بخش Hosts، سرور مورد نظر را انتخاب کرده و سپس در قسمت Item یک آیتم جدید برای آن سرویس تعریف شود.
در بخش آیتم جدید اطلاعات مربوط به آن سرویس مشخص خواهد شد و پارامترهای مختلفی همانند بازه زمانی بررسی هر سرویس نیز، قابل تعریف است.
بعد از تعریف آیتم مربوط به آن سرویس لازم است Trigger مربوط به آیتم ثبت شده را ایجاد کنیم. در این بخش مشخص میشود که هر سرویس در چه حالاتی ذیل چه دسته ای از خطا/مشکل ها باید قرار بگیرد.
به عنوان مثال در این بخش مشخص شده است که بعد از ۳ درخواست ناموفق وضعیت آیتم در دستهبندی High قرار گیرد.
نوع دستهبندی، نام، مشخصات آیتم، و سایر تنظمیات مربوط به آن مطابق با فیلدهای مشخص شده در تصویر زیر تنطیم می شود.
برای هر Trigger بعد از قرار گرفتن در یک دستهبندی میتوان فعالیت خاصی را نیز انجام داد. به عنوان مثال می توان مشخص نمود وقتی که در دسته بندی High قرار بگیرد پیامکی برای افراد ذیربط ارسال کند. این فعالیت میتواند به شکلهای مختلف انجام پذیرد.
6 – مدیریت کاربران
برای مدیریت کاربران میتوان از طریق منوی Administration سمت چپ سیستم و سپس Users به بخش مدیریت کاربران دسترسی پیدا کرد:
در صورت نیاز به اضافه کردن کاربر در همین صفحه و در بالای سمت راست میتوانید دکمه Create User را کلیک نمایید و بعد از پر کردن فرم به صورت زیر میتوانید با کلیک دکمه Add کاربر جدید را اضافه نمایید.
لازم به ذکر است که در بخش Groups باید WSO2 را اضافه نمود تا کاربر دسترسی به داشبورد را داشته باشد. همچنین برای دریافت پیامک در تب Media با طی کردن مراحل زیر شماره کاربر را وارد نمایید:
7 – مدیریت Hostها
برای مدیریت سرورها کافی است مانند شکل زیر بخش Hosts را باز نمایید. در صورت نیاز آیتم یا تریگر جدید به Host اضافه نمایید یا آنها را ویرایش کنید.
شرکت دانش بنیان پلتکو، ارائه دهنده خدمات تخصصی یکپارچه سازی و مدیریت وبسرویسها می باشد که خدماتی نظیر گذرگاه سرویسهای سازمانی (ESB) و مدیریت وبسرویسها (API Manager)، مانیتورینگ، مدیریت لاگها، وب پرتال و دهها سرویس تخصصی دیگر به سازمانها ارائه میدهد.
در این مطلب به طور کامل مستند کاربری ماژول مدیریت مانیتورینگ پلتفرم پلتکو ارائه شد و تمامی مراحل مدیریت مانیتورینگ پلتفرم پلتکو همراه با تصاویر و بیان جزئیات شرح داده شد. امیدواریم اطلاعات کافی را درباره این مبحث بدست آورده باشید. سوالات، پیشنهادات و نظرات خود را با ما به اشتراک بگذارید.
بدون دیدگاه