مستند کاربری ماژول مانیتورینگ پلتفرم پلتکو

ماژول مانیتورینگ یک ابزار یا سیستم نرم‌افزاری است که برای مانیتور کردن و نظارت بر عملکرد یک سیستم یا شبکه استفاده می‌شود. این ماژول‌ها معمولاً اطلاعاتی را درباره‌ی وضعیت و عملکرد سیستم یا شبکه به کاربر ارائه می‌دهند تا او بتواند به مشکلات و ایرادات سریعاً پاسخ دهد.

کاربری ماژول مانیتورینگ شامل موارد زیر می‌شود:

  1.  نظارت بر وضعیت سرورها، شبکه‌ها، دیتابیس‌ها و سایر اجزای سیستم.
  2. ثبت و نمایش آمارها و معیارهای عملکرد سیستم.
  3. اعلان‌ها و هشدارها در صورت وقوع خطا یا مشکلات در عملکرد.
  4. ذخیره و نگهداری داده‌های مانیتورینگ برای تجزیه و تحلیل بعدی.

با استفاده از ماژول مانیتورینگ، کاربران می‌توانند بهبود عملکرد و بهینه‌سازی سیستم‌های خود را انجام دهند و از ایرادات و مشکلات به‌صورت سریع پاسخگو باشند.  در ادامه این مطلب با شرکت دانش بنیان پلتکو همراه باشید تا مستندات کاملی را جهت استفاده کاربری ماژول مانیتورینگ پلتفرم پلتکو ارائه دهیم.

1. مقدمه

این مستند به عنوان راهنمای استفاده از نرم افزار Zabbix برای پایش سیستم پلتکو تهیه شده است و جزییات مربوط به آن را شرح می دهد.
ماژول مانیتورینگ پلتکو برای پایش منابع (شاملCPU ، RAM و Storage ، کارت شبکه و غیره) ماشین ها و خدمات(خدمات سرویس دهندگان مختلف و خدمات واسط) راه اندازی شده است. پایش سیستم با استفاده از نرم‌افزار متن بازzabbix نسخه ۶.۲ با لایسنس GPL که در ادامه به شرح بخش‌های مهم آن پرداخته شده ، انجام می شود:

برای راه اندازی ماژول مانیتورینگ بایستی بسته های نرم افزاری زیر بر روی سرور میزبان نرم افزار زبیکس نصب شود:

  • بسته postgres-server به عنوان پایگاه داده سرور زبیکس مورد استفاده قرار می‌گیرد.
  • بسته zabbix-server-psql برای نصب و راه‌اندازی سرور زبیکس مورد استفاده قرار می‌گیرد. این بسته وظیفه فراخوانی سرویس‌ها و جمع‌آوری اطلاعات از هاست‌های زیرساخت را برعهده دارد.
  • پکیج‌ zabbix-web-nginx-pgsql برای راه‌اندازی پنل تحت وب زبیکس مورد استفاده قرار می‌گیرد. همچنین این پکیج وظیفه راه‌اندازی یک وب‌سروری برای اجرای زبیکس را نیز بر عهده دارد.
  • پکیج‌ zabbix-agent برای راه‌اندازی agent زبیکس بر روی ماشین های هدف مانیتورینگ مورد استفاده قرار می‌گیرد. این پکیج وظیفه جمع‌آوری اطلاعات از روی هاست های هدف و انتقال آن به زبیکس سرور را دارد.

از جمله مواردی که توسط ماژول مانیتورینگ، پایش می‌شوند عبارتند از: منابع (شاملCPU ، RAM و Storage) ، سلامت ماژول های نرم افزاری پلتفرم (مانند kafka ، psql و …)، پورت‌ها، و سرویس Health-Check مربوط به دسته های مختلف سرویس ها.

علاوه بر اینها می‌توان امکان پایش ارتباط و خدمات سرویس دهندگان ثالث بیرونی را نیز اضافه نمود اما پایش خدمات فقط برای سرویس هایی که ماهیت دریافت اطلاعات را دارند امکان پذیر است نه برای سرویس هایی که تغییراتی را در جایی اعمال می کنند.

2. صفحه ورود

با وارد کردن آدرس سرویس Zabbix صفحه ورود به سیستم را مشاهده خواهید نمود:

 

ماژول مانیتورینگ پلتکو

 

با وارد کردن اطلاعات کاربری خود (نام کاربری/رمز عبور) وارد سامانه شوید.


3 – داشبورد WSO2

بعد از ورود به سامانه مدیریت مانیتورینگ به داشبورد WSO2 منتقل می‌شوید. همچنین می‌توانید مانند تصویر زیر از منوی سمت چپ، به این داشبورد دسترسی داشته باشید:

 

 

ماژول مانیتورینگ پلتکو

 

با ورود به داشبورد در بالای سمت راست داشبورد می‌توانید از فیلتر بازه زمانی استفاده کنید و وضعیت‌های مربوط به روز جاری یا ۱۵ دقیقه اخیر را مشاهده کنید:

 

ماژول مانیتورینگ پلتکو

 

همانگونه که در تصویر زیر مشاهده می‌کنید این داشبورد از صفحات مختلفی تشکیل شده است که در هر صفحه اطلاعات متفاوتی از وضعیت سامانه‌ها، سرویس‌ها و … نمایش داده می‌شود.

 

مستند کاربری ماژول مانیتورینگ پلتکو

 

در ادامه به شرح هر یک از این صفحات می‌پردازیم:

صفحه Overview:

صفحه overview خلاصه‌ای از وضعیت‌ها و مشکلات را نشان می‌دهد و از بخش‌های مهم آن می‌توان به موارد زیر اشاره کرد:

  • Top hosts by CPU utilization: اطلاعات منابع (حافظه، دیسک و پردازنده) تمام سرورهای Worker، Master و Storage را به صورت خلاصه نمایش می‌دهد.
  • Current problems: اطلاعاتی از آخرین مشکلات رخ داده را نمایش می‌دهد. در این بخش سطح، شرح و زمان این مشکلات قابل مشاهده است.
  • System information: اطلاعات کلی سرور زبیکس را نمایش می‌دهد.
  • Action Log: در این بخش اقدامات و اطلاع‌رسانی‌های انجام شده توسط زبیکس قابل مشاهده است. برای مثال در حالتی که یکی از Endpointها از دسترس خارج شود، رخدادی در سطح High رخ می‌دهد اطلاع‌رسانی‌های مرتبط با آن در این بخش قابل مشاهده است. در این نمایش، نوع پیام، محتوای پیام، گیرنده و زمان ارسال قابل مشاهده است.

مستند کاربری ماژول مانیتورینگ پلتکو

 

صفحه Endpoint Status:

 

مستند کاربری ماژول پلتکو

صفحه Endpoint Status آخرین وضعیت Endpointها و همچنین سامانه‌های داخلی نظیر ELK و AM را نشان می‌دهد و شامل نمودارهای زیر است. لازم به ذکر است که Endpointها و سامانه‌ها در بازه‌های زمانی کوتاه، با درخواست‌های API مورد بررسی قرار می‌گیرند.

  •  Connecting Issue in Servers: در صورتی که درخواست‌های API بدون پاسخ بماند خطای آن در این نمودار قابل مشاهده است.
  •  Server Status Codes: کد وضعیت درخواست‌های ارسالی به Endpointها و سامانه‌های سرویس دهنده را نمایش می‌دهد.

لازم به ذکر است که کد‌های ارسالی مورد انتظار برای هر Endpoint یا سامانه سرویس دهنده متفاوت است.

صفحه API Status:

در این صفحه آخرین وضعیت هر کدام از سرویس‌های مورد استفاده توسط کاربران قابل مشاهده است

کد وضعیت ۵۰۰ برای سرویس‌ها به منزله خطای درون سامانه‌ای تشخیص داده می‌شود و در صورت رخداد به افراد مرتبط اطلاع‌رسانی انجام می‌گیرد.

صفحه Server Resource:

این صفحه وضعیت و تاریخچه منابع (ترافیک، حافظه، پردازشگر و دیسک) مورد استفاده سرورها را نشان می‌دهد:

 

مستند کاربری ماژول مانیتورینگ پلتکو

صفحه Server Health:

این صفحه تاریخچه وضعیت زبیکس و ماژول‌های آن را نشان می‌دهد:

 

مستند کاربری ماژول مانیتورینگ پلتکو

 

4. نحوه مانیتورینگ سرویس‌ها و سطوح Problemها

نحوه سرویس مانیتورینگ در سامانه پلتکو به طور کلی در موارد زیر خلاصه می‌شوند:

– منابع سرور مانند حافظه، دیسک، پردازشگر و واسط شبکه: با توجه به تریگرهایی تعریف شده در صورتی که هر یک از منابع سرور در حد بحرانی قرار گیرد،‌ یک Problem با سطح Average ایجاد می‌شود.

این موارد به صورت زیر دقیق می‌شوند:

  • 0 فضای خالی دیسک کمتر از ۱۰ درصد باشد
  • 0 فضای خالی حافظه تصادفی کمتر از ۱۰ درصد باشد
  • 0 بار پردازشگر بیشتر از یک باشد
  • 0 یکی از واسط‌های شبکه از دسترس خارج شود

– Connection بر روی Endpointها: در هر 15 ثانیه یک درخواست https به هر یک از Endpointها ارسال می‌شود و در صورتی که از ده درخواست حداقل ۵ خطا دیده شود یک Problem با سطح High ایجاد می‌شود.

– نظارت کد خطاهای Endpoint ها: در هر 15 ثانیه یک درخواست https به هر یک از Endpointها ارسال می‌شود و در صورتی که از ده درخواست حداقل ۵ کد خطا یکسان دیده شود یک Problem با سطح High ایجاد می‌شود.

– Health-Check بر روی سرویس‌های اصلی سامانه مانند AM و PI: در هر 15 ثانیه یک درخواست https به هر یک از سرویس‌ها ارسال می‌شود و در صورتی که از ده درخواست حداقل ۵ خطا دیده شود یک Problem با سطح Disaster ایجاد می‌شود.

– Health-Check بر روی سرویس‌های ثانویه سامانه مانند ELK: در هر 15 ثانیه یک درخواست https به هر یک از سرویس‌ها ارسال می‌شود و در صورتی که از ده درخواست حداقل ۵ خطا دیده شود یک Problem با سطح High ایجاد می‌شود.

برای هر یک از موارد فوق اطلاع‌رسانی به اپراتورها از طریق پیامک صورت می‌گیرد. همچنین نظارت‌های دیگری وجود دارد که در سطح پایین تر از Average قرار می‌گیرد و در این بخش نیامده‌اند. این موارد در صورت بروز، فقط در داشبورد و در بخش Problems آن قابل مشاهده هستند.

5 – افزودن قابلیت مانیتورینگ سرویس ها به Zabbix

برای افزودن امکان مانیتورینگ یک سرویس نوعی ، فرایند زیر طی می‌شود:

در ابتدا لازم است از بخش Hosts، سرور مورد نظر را انتخاب کرده و سپس در قسمت Item یک آیتم جدید برای آن سرویس تعریف شود.

مستند کاربری مانیتورینگ پلتکو

در بخش آیتم جدید اطلاعات مربوط به آن سرویس مشخص خواهد شد و پارامترهای مختلفی همانند بازه زمانی بررسی هر سرویس نیز، قابل تعریف است.

 

مستند کاربری ماژول مانیتورینگ پلتفرم پلتکو

 

بعد از تعریف آیتم مربوط به آن سرویس لازم است Trigger مربوط به آیتم ثبت شده را ایجاد کنیم. در این بخش مشخص می‌شود که هر سرویس در چه حالاتی ذیل چه دسته‌ ای از خطا/مشکل ها باید قرار بگیرد.

به عنوان مثال در این بخش مشخص شده است که بعد از ۳ درخواست ناموفق وضعیت آیتم در دسته‌بندی High قرار گیرد.

 

مستند کاربری ماژول مانیتورینگ پلتفرم پلتکو

نوع دسته‌بندی، نام، مشخصات آیتم، و سایر تنظمیات مربوط به آن مطابق با فیلد‌های مشخص شده در تصویر زیر تنطیم می شود.

مستند کاربری ماژول مانیتورینگ پلتکو

 

برای هر Trigger بعد از قرار گرفتن در یک دسته‌بندی می‌توان فعالیت خاصی را نیز انجام داد. به عنوان مثال می توان مشخص نمود وقتی که در دسته بندی High قرار بگیرد پیامکی برای افراد ذیربط ارسال کند. این فعالیت می‌تواند به شکل‌های مختلف انجام پذیرد.

مستند کاربری ماژول مانیتورینگ پلتکو

مستند کاربری ماژول مانیتورینگ پلتکو

6 – مدیریت کاربران

برای مدیریت کاربران می‌توان از طریق منوی Administration سمت چپ سیستم و سپس Users به بخش مدیریت کاربران دسترسی پیدا کرد:

 

مستند کاربری ماژول مانیتورینگ پلتکو

 

در صورت نیاز به اضافه کردن کاربر در همین صفحه و در بالای سمت راست می‌توانید دکمه Create User را کلیک نمایید و بعد از پر کردن فرم به صورت زیر می‌توانید با کلیک دکمه Add کاربر جدید را اضافه نمایید.

 

مستند کاربری ماژول مانیتورینگ پلتکو

لازم به ذکر است که در بخش Groups باید WSO2 را اضافه نمود تا کاربر دسترسی به داشبورد را داشته باشد. همچنین برای دریافت پیامک در تب Media با طی کردن مراحل زیر شماره کاربر را وارد نمایید:

 

مستند کاربری ماژول مانیتورینگ پلتکو

7 – مدیریت Hostها

برای مدیریت سرورها کافی است مانند شکل زیر بخش Hosts را باز نمایید. در صورت نیاز آیتم یا تریگر جدید به Host اضافه نمایید یا آن‌ها را ویرایش کنید.

مستند کاربری ماژول مانیتورینگ پلتکو

شرکت دانش بنیان پلتکو، ارائه دهنده خدمات تخصصی یکپارچه سازی و مدیریت وب‌سرویس‌ها می باشد که خدماتی نظیر گذرگاه سرویس‌های سازمانی (ESB) و مدیریت وب‌سرویس‌ها (API Manager)، مانیتورینگ، مدیریت لاگ‌ها، وب پرتال و ده‌ها سرویس تخصصی دیگر به سازمان‌ها ارائه می‌دهد.

در این مطلب به طور کامل مستند کاربری ماژول مدیریت مانیتورینگ پلتفرم پلتکو ارائه شد و تمامی مراحل مدیریت مانیتورینگ پلتفرم پلتکو همراه با تصاویر و بیان جزئیات شرح داده شد. امیدواریم اطلاعات کافی را درباره این مبحث بدست آورده باشید. سوالات، پیشنهادات و نظرات خود را با ما به اشتراک بگذارید.

این مطلب چقدر مفید بود ؟

روی یک ستاره کلیک کنید تا به آن امتیاز دهید

میانگین امتیاز / 5. نتایج آرا:

تاکنون رأی ندارید! اولین نفری باشید که به این پست امتیاز می دهد.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *