2018年11月28日 星期三

[經驗分享]LibreNMS無法取得某些FreeNAS儲存區資訊



我在機房中有一台 FreeNAS 9.10 版,但這台機器一直無法讓 LibreNMS 讀取到正確的儲存區資訊,困擾已久。



狀況

LibreNMS 可以經由 SNMP 協定取得儲存伺服器的儲存區容量,對於管理者來說可以統一管理並制訂警報發送條件,但這台一直無法抓到,困擾很久。

從一開始就懷疑是這台 FreeNAS 版本的問題,因為其它台 FreeNAS 的版本都是 9.10.2 以上,沒有這個情況存在。




完全空白的儲存區資訊




追查


直到最近,我將這台 FreeNAS 原地更新到 9.10.2-U6,沒想到情況仍然存在。

這樣看來變數就多了,我試著在 LibreNMS 用 SNMP v3 去對這台 FreeNAS 連接,一樣沒有改善。

不經意在 LibreNMS Github 的 Issue 裡瞄了一篇,提到同樣的問題:

FreeNAS 9.10 - Storage disks/mounts not discovered

沒錯,真的是 9.10 才有的問題,但我從 9.10 升級到 9.10.2-U6 還是發生,但如果是全新安裝則不會。

再往下看,這名網友分享了這個資訊:

It's definitely some bug in FreeNAS or FreeBSD. Discovery works OK when using SNMP v1. Older FreeNAS server is polled using SNMPv2, and it is working OK.


我抱著嘗試心態試了一下,改用 SNMP v1 去問這台 FreeNAS,竟然真的都出現啦!



終於正常的儲存區資訊



設定位置在 Device 裡的 SNMP 頁籤,簡單切換即可。



切換 Device 輪詢時使用的 SNMP 版本




參考

2018年11月26日 星期一

[經驗分享]基礎程式locale、ldconfig等消失事件



繼前陣子發生 MariaDB 會自己消失的離奇事件後,今天又發生另一起消失事件。



狀況

為了搞定 BookStack 套件的 PDF 中文匯出問題需要安裝 gblic 2.27 版本,但 Ubuntu 16.04 能提供到的版本是 2.23,後來搞了半天是真的把 2.23 給移除了,但結果是連許多基礎套件都幹掉了。




移除 libc-bin 時同時也移除好幾個套件




追查


本來只是為了移除 gblic 2.23,結果不僅 2.27 裝不上去,連其它基礎程式都掛了,例如 locale、apt 等很多東西都異常,類似以下的訊息

Can’t exec “locale”: No such file or directory at /usr/share/perl5/Debconf/Encoding.pm line 16. Use of uninitialized value $Debconf::Encoding::charmap in scalar chomp at /usr/share/perl5/Debconf/Encoding.pm line 17.

這下麻煩了。

翻查資料研究後,需要手動把 ldconfig 給弄回來。

apt-get download libc-bin
dpkg -x libc-bin*.deb unpackdir/
sudo cp unpackdir/sbin/ldconfig /sbin/

接著再重新安裝一次 gblic 套件。

sudo apt-get install --reinstall libc-bin 
sudo apt-get install -f

    好了,現在修復完成。

    等等,你可能會想到一件事:開頭提到的 BookStack 匯出 PDF 中文版問題需要 2.27,可是你裝回的是 2.23 還是沒解決啊?

    是的,經過爬文,需要 Ubuntu 18.04 才能使用 2.27,所以...... 我做了 do-release-upgrade 把 Ubuntu 16.04 更新到 18.04 了,結案!

    補充一下大版本更新經驗:

    • 10.04 to 12.04 = 死
    • 12.04 to 14.04 = 死
    • 14.04 to 16.04 = 系統活著,但死掉一堆套件 (那還是不能用啊)
    • 16.04 to 18.04 = 奇蹟的活下來了!



    參考




    2018年11月22日 星期四

    [經驗分享]MariaDB服務消失的離奇事件



    近日架設 Moodle 當做測驗平台,卻無意中遇到一件離奇的事:資料庫服務自己消失了。



    狀況

    為了快速建置,這次我採用了 TurnKeyLinux (TKL) 所打包的 VM 檔,直接開機後一步一步往下操作,就立即完成可用的 Moodle 系統。

    上線一天後,忽然 LibreNMS 發出 Moodle 服務異常警報,一試之下真的出錯。

    Moodle 掛了



    追查

    第一次發生時,以為是自己架設有問題或沒調整好,就先倒回正常的快照點,讓系統恢復運作。

    沒想到隔天下午又發生一次,ssh 連至主機查看,發現 mariadb 服務沒有運作,甚至連 service 的status/start/stop 都無法執行!

    這可嚇壞我了,檢查一下設定檔都還在,但是關鍵的 mariadb.service 卻消失了。
    Mariadb.Service 消失



    這就有點不太對勁了,難道是惡意程式或入侵?

    認真想了一下,是不是更新造成的問題?因為我有開啟 TurnKeyLinux 的 Security Patch 自動安裝,那就來試試看。



    執行 TurnKeyLinux Security Patch


    手動執行更新後發現關鍵字了,更新時「REMOVED」、「mariadb-server-10.1」 ...等,Mariadb 在這裡被移除,再往下看又另安裝了「mariadb-server-core-10.1」這個版本。

    既然有重新安裝起來,為什麼服務會不見呢?

    所以我又還原一次快照點,這次先把 mariadb.service 備份起來,更新完再 copy 回去,服務就能繼續正常運作。




    參考

    就在我解決不久後,同事剛好也查到相關資料,不看還好,一看令人扼腕。

    因為我在 11/20 遇到問題,11/21 自己追查解決,結果這問題正是 11/20 超級新鮮,剛出爐的就被我遇到........

    TurnKeyLinux 的官方說法,表示這問題是 Debian 的更新出了問題,大約有 70% 的使用者會遇到,他們建議的方法是「重新安裝一次 mariadb 即可」。

    apt update
    apt install default-mysql-server






    2018年11月21日 星期三

    [功能測試]各家Office軟體"裝訂線"對決



    公務文件最常出現的「裝訂線」,經常是讓 Microsoft Office 以外文書軟體顯示問題的應用,我們再來看看在各家 Office 近期版本上呈現到底會如何呢?

    一次全開,立知高下。

    ※ 這篇文章其實在五月時已經完成,卻一直忘了發。


    裝訂線呈現對照圖 (點選看大圖)


    圖中由左至右分別為:

    1. NDC ODF Application Tools (國發會ODF文件應用工具)
    2. LibreOffice
    3. FreeOffice
    4. OnlyOffice
    5. Microsoft Office


    從結果來看,第1、2、4都可以呈現裝訂線,但4會有文字破碎問題。

    因此,若要非 Microsoft Office 開啟這類文件,可以參考 NDC ODF Application Tools、LibreOffice。

    註:奇怪的是,這次測試第1、2項裝釘線上有留空卻沒呈現文字(之前會有),這個我再測試看看。




    參考資料



    2018年11月18日 星期日

    [行業觀察]IT維運六備輪迴




    經過多年的IT職涯心得,歸納出我稱之為「六備輪迴」的悲劇事實。


    六個「備」字


    越往下走,成本越驚人。

    備註

    對於手上管理的主機都要做好說明與記錄。

    備份

    重要資料都應該保存一個以上的複本,更理想的是 3-2-1

    備品

    沒有不會故障的零件,隨時備妥即時更換。

    備援

    若有備援系統,線上主機故障可以立即切換,繼續運作。

    備員

    天有不測風雲,人有旦夕禍福。代理或接手人員的重要性不亞於備援設備。

    備案

    嗯...只好上警局寫簿子了。



    最後的備案可能導致丟了工作,所以下一份工作又從備註開始了...



    ※ 這篇文章純屬喇賽
    ※ 如有雷同純屬巧合

      

    2018年11月10日 星期六

    [議程簡報]LibreNMS 企業實戰經驗分享



    LibreNMS 是我使用多年的優秀開源套件,在這次議程中我將分享它的功能介紹、進階功能,以及我在企業中實際應用的經驗談。




    管理問題


    在網路裝置日益成長的情況下,管理人員的負擔也持續加劇。






    相信身為資訊人員的你,寥寥數語肯定讓你看的直是點頭。


    評估重點


    當時如何評估選擇要使用的方案呢?

    以我的經驗,最終歸納出為這幾點,做為比較套件時的指標:

    • 監控眾多裝置
    • 保存歷史數據
    • 支援類型廣泛
    • 自訂裝置分組
    • 美觀好用介面
    • 設定簡單容易
    • 多種認證機制
    • 多樣警報機制
    • 外掛擴充能力
    • 支援二次開發



    監測方式


    LibreNMS 採了基本 + 進階 + 外掛的監視方法,您可以依據需求決定要做到那個程度。








    剩下的細節,請直接前往簡報平台閱讀,若您未參與活動,則建議先閱讀相關資料的第二個連結,再前往觀看完整簡報。



    相關資料