Ringkasan Eksekutif
ALESA NOVA Server ialah platform pengkomputeran on-premises yang menggabungkan perkakasan kelas pelayan, susun lapis model AI sumber terbuka, kerangka ALESA Framework terkini, dan kontrak penyelenggaraan 3 tahun ke dalam satu produk bersepadu yang boleh dipasang dalam premis agensi atau syarikat klien.
Berbeza daripada penyelesaian awan tradisional yang memerlukan data klien dihantar keluar dari premis, NOVA Server menyediakan kedaulatan data on-premises dengan menjalankan semua pemprosesan AI, pengkomputeran aplikasi, dan penyimpanan data di atas perkakasan yang dimiliki dan dikawal oleh klien.
Reka bentuk platform ini direka untuk menyokong 11 kelas beban kerja serentak dalam satu kotak: ALESA GovERP, jambatan sistem warisan COBOL/AS400, aplikasi perbankan, HR/Payroll, sistem kesihatan, asisten pembangun AI, pemproses dokumen AI, tenaga kerja ejen ALESA berbilang, analitik perniagaan, sandaran/DR, dan audit pematuhan.
Ekonomi platform ini menarik: dengan menjalankan model AI sumber terbuka berkualiti komersial (DeepSeek v4.0, Qwen 2.5, Llama 3.1) secara tempatan, klien menjimatkan RM 30-40 ribu setahun per pembangun berbanding penggunaan API awan sahaja. Bagi jabatan dengan ~10 pembangun aktif (penjimatan RM 300-400k setahun), Tier Standard (RM 400k tahun pertama, all-in) lazimnya membayar balik dalam tempoh 12-18 bulan.
Penyampaian platform ini berlandaskan disiplin tadbir urus ALESA yang ketat — kerangka PCEB Gate v4, Code Quality Doctrine v1, Grandmaster Coder Doctrine, dan format cadangan kerajaan yang dirintis oleh Penasihat Strategik Dr Shuhaizam Zain (Doc Zam).
AI sudah bertindak sendiri. Persoalannya — siapa yang mengawal?
AI generasi hari ini bukan lagi sekadar menjawab. Ia menulis kod, membuat keputusan, mengakses data, dan mengambil tindakan. Tanpa lapisan kawalan yang betul, satu kesilapan boleh menjadi kebocoran data, keputusan berat sebelah, atau kegagalan sistem — dengan kos sebenar kepada organisasi anda.
NOVA Server bukan sekadar enjin AI — ia enjin AI berserta tali pinggang keledarnya dalam satu kotak. Kedaulatan data dan tadbir urus AI bukan tampungan kemudian; ia terbina dari Hari 1.
Tingkapnya terbuka sekarang. Pasang tadbir urus AI sebelum insiden, bukan selepas. Fahami kenapa governance AI penting →
Konteks Pasaran & Pemicu Strategik
Realiti pasaran AI 2026
- Kos API AI awan melonjak — Claude, OpenAI, Gemini API kini mencapai RM 3,000–5,000 sebulan per pembangun aktif. Bagi pasukan 10 pembangun, kos ini menjadi RM 360,000–600,000 setahun yang berulang selamanya.
- Kebimbangan kedaulatan data — sektor kerajaan, perbankan, dan kesihatan Malaysia kini menghadapi tekanan kawal selia yang lebih ketat berkenaan tempat data diproses dan disimpan.
- MAMPU Cloud First yang diperhalusi — hanya awan bersijil MAMPU yang diterima untuk projek kerajaan persekutuan; namun tidak semua agensi selesa dengan model awan.
- BNM RMiT (Risk Management in Technology) — institusi kewangan memerlukan kawalan on-premises untuk sistem teras.
- PDPA 2010 + pindaan 2024 — sekatan pemindahan data merentas sempadan menjadikan model awan asing tidak praktikal.
- Kualiti AI sumber terbuka mencapai paras komersial — DeepSeek v4.0 (671B MoE), Qwen 2.5 (72B), Llama 3.1 (70B+) kini setanding model awan komersial.
- Harga perkakasan AI menurun — GPU enterprise seperti NVIDIA RTX 6000 Ada (48GB) kini ~RM 25-35k, menjadikan deployment on-premises ekonomik.
Pemicu utama agensi pertimbang on-premises
- Pengeluaran daripada SAP / Oracle / platform asing (kos lesen membebankan)
- Keinginan membina kapasiti AI dalaman (model SIRIM, model UniKL)
- Modenisasi sistem warisan (COBOL, AS/400) yang memerlukan akses DB sensitif
- Konsolidasi pelbagai langganan SaaS ke dalam satu platform
- Audit Negara dan keperluan kawal selia yang menuntut kawalan fizikal
Objektif Penyampaian
Objektif strategik (3 tahun)
- O1 — Platform tunggal: menyatukan sehingga 11 beban kerja sensitif dalam satu platform terurus tunggal.
- O2 — Kedaulatan data: dalam konfigurasi local-only, pemprosesan dan penyimpanan kekal dalam premis klien; sifar pemindahan data merentas sempadan.
- O3 — Penjimatan AI: mengurangkan kos API AI awan sebanyak 70-80% melalui model sumber terbuka tempatan.
- O4 — Pematuhan + penguatkuasaan teruji: seni bina diselaraskan dengan MAMPU PSPA, PDPA, BNM RMiT, MOH dan piawaian Audit Negara. Lapisan penguatkuasaan (identiti+MFA, policy-enforcement-point, audit tamper-detectable, kawalan model-agnostik — semua model patuh) dibina + diuji: 45 ujian boleh tuan run sendiri; diaktifkan atas perkakasan on-prem tuan.
- O5 — Beban operasi minima: klien hanya perlu 1-2 "AI Commander" bertauliah; ALESA tangani Tier 2/3 selepas serahan.
Objektif teknikal
- O6 — Ketersediaan platform ≥ 99.5% bulanan dengan HA pada tier Standard+.
- O7 — RTO ≤ 4 jam, RPO ≤ 15 minit selepas penuh deployment.
- O8 — Naik taraf model AI suku tahunan tanpa downtime ketara.
- O9 — Sokongan minimum 100 pengguna serentak pada tier Standard.
- O10 — Backup geo-redundan dengan ujian pemulihan suku tahunan.
MSI EdgeXpert MS-C931 — 1 PetaFLOP AI di Atas Meja
Imej: ihsan MSI USA (us.msi.com)
NOVA Server v2.0 dibina di atas MSI EdgeXpert MS-C931 — sistem AI ringkas (1.19 liter, 1.2kg) yang dikuasakan oleh NVIDIA GB10 Grace Blackwell Superchip, perkakasan sama yang menggerakkan NVIDIA DGX™ Spark. Setiap unit memberikan 1 petaFLOP prestasi AI tensor dengan keupayaan menjalankan model bahasa hingga 200 bilion parameter secara tempatan, atau 405B melalui konfigurasi dual-stack ConnectX-7.
Mengapa MSI EdgeXpert untuk Konteks Agensi Malaysia?
GB10 Superchip · NVLink-C2C · 1 PFLOP FP4 · 273 GB/s bandwidth
200B local · 405B dual-stack · skala ke DGX cloud seamless
Perbandingan vs Alternatif
| Sistem | Memori AI | Prestasi | Kuasa | Kedaulatan Data | Sesuai Agensi MY? |
|---|---|---|---|---|---|
| MSI EdgeXpert MS-C931 | 128GB unified | 1 PFLOP FP4 | ~150W | 100% on-prem | ✓ Optimum |
| Mac Studio M3 Ultra | 192GB unified | ~30 TOPS | ~370W | 100% on-prem | Terhad LLM 70B+ |
| NVIDIA DGX Workstation (x86) | 512GB-1TB | ~3 PFLOP | ~1500W | 100% on-prem | Mahal · besar |
| RTX 6000 Ada Workstation | 48GB VRAM | ~91 TFLOPS | ~600W | 100% on-prem | Tak mampu 150B+ |
| Cluster GPU Cloud Sewa | Tanpa had | Skala | — | Data keluar | Gagal MAMPU/BNM |
Sumber spec rasmi: MSI EdgeXpert MS-C931 Official Page →
Skop — 11 Kelas Beban Kerja
NOVA Server direka untuk menghos pelbagai aplikasi sensitif serentak. Setiap kelas beban kerja boleh diaktifkan mengikut keperluan klien dan tier perkakasan yang dipilih.
Senibina Teknikal
Susun lapis platform (4 lapisan logikal)
Topologi rangkaian (rujukan tier Standard)
Internet (Unifi/UMobile/TM Fiber, 24/7)
│
Firewall Klien (sedia ada)
│
Edge Router NOVA (terurus)
├── NOVA Server 1 (primary)
├── NOVA Server 2 (HA replica)
├── Storage NAS (sandaran + warm tier)
└── VLAN Pengurusan (iDRAC/iLO + Prometheus + Sentry)
Stack AI & Corak "Free Lead"
NOVA Server menggunakan pendekatan orkestra AI berbilang tier yang unik: model berbayar (Claude/OpenAI) mengetuai dan menyalurkan kerja berat kepada model sumber terbuka yang berjalan secara tempatan. Hasilnya: kualiti AI gred premium dengan kos operasi 1/3.
Corak orkestra AI berbilang tier
🎖 Master Tier — Disimpan di HQ ALESA
Claude Opus 1M konteks. Hanya dipegang oleh Pengasas ALESA untuk pemikiran strategik kompleks. Tidak pernah disebarkan ke premis klien.
⚡ Lead Tier — Orkestra di Premis Klien
Claude Sonnet (berbayar). Bertindak sebagai komander on-site untuk koordinasi kompleks, semakan kod, dan keputusan kritikal.
🔧 Worker Tier — Model Sumber Terbuka Tempatan
Mengendalikan 70-80% beban inference: Q&A umum, rumusan, terjemahan BM/EN, dokumen besar. Sifar kos API.
🎯 Specialist Tier — Model Pakar Tempatan
Model dikhususkan untuk kod: penjanaan, refactoring, terjemahan bahasa warisan (COBOL → moden), penyiapan kod pantas.
Ekonomi penjimatan AI
Senario pasukan 5 pembangun aktif:
| Komponen | Cloud Sahaja (setahun) | NOVA Server (setahun) | Penjimatan |
|---|---|---|---|
| API AI (Claude/OpenAI) | RM 240,000 (RM 4k × 5 dev × 12 bln) | RM 48,000 (Lead tier sahaja) | RM 192,000 |
| Pakej NOVA Server all-in (purata 3 thn · termasuk penyelenggaraan tahunan) | — | RM ~150,000/tahun | — |
| Jumlah tahunan | RM 240,000 | RM ~198,000 | ~RM 42,000/tahun + kedaulatan data penuh |
Catatan: kiraan ini konservatif. Dengan pasukan 10+ pembangun atau penggunaan AI berat (Document AI, multi-agent workforce), penjimatan boleh mencecah RM 500k-1M setahun.
Performance Benchmark per Model AI
Anggaran prestasi konservatif berdasarkan spesifikasi NVIDIA GB10 Grace Blackwell pada satu unit MSI EdgeXpert MS-C931 (128GB unified memory, 273 GB/s bandwidth, 1 PFLOP FP4). Angka sebenar dimuktamadkan semasa UAT khusus beban kerja setiap deployment — bukan janji "pemasaran".
| Model AI | Format | Throughput | Latensi (100 tok output) | Use Case | Tier disyorkan |
|---|---|---|---|---|---|
| Llama 3.1 70B | Q4 GPTQ | 20-30 tok/s | < 3s | Chatbot agency, RAG policy assistant | Pilot (1 unit) |
| DeepSeek v4 235B | Q4 AWQ | 8-12 tok/s | ~8s | Analitik kompleks, code review, banking ops | Standard (2 unit · dual-stack) |
| Qwen 2.5 Coder 32B | FP16 | 40-50 tok/s | < 500ms | ALESA dev co-pilot, code generation | Pilot/Standard |
| Qwen 2.5 72B | Q4 | 22-28 tok/s | < 3s | General-purpose Malaysian language tasks | Standard |
| Whisper Large v3 | FP16 | 10-15× realtime | — | Transkripsi panggilan customer service / meeting | Pilot |
| Embedding (BGE-M3) | FP16 | ~5,000 docs/min | — | RAG indexing, semantic search | Pilot |
| OCR (DocAI batch) | FP16 | 3,000-5,000 dokumen/jam | — | JPN INPReS, kad pengenalan, sijil batch | Standard |
Janji UAT Penampilan (Performance UAT Promise)
Setiap Deployment NOVA Server termasuk UAT khusus beban kerja anda
Sebelum penyerahan akhir, ALESA menjalankan TRACE Gate (per ALESA Work SOP v1.5) untuk setiap kelas beban kerja yang ditentukan: probe executable, output dijangka, output sebenar, verdict. Tiada "good enough" · Tiada lint-only verification · Real UAT mandatory.
- R1 Latensi: p50 / p95 / p99 setiap endpoint AI
- R2 Throughput: concurrent users sebelum degradasi
- R3 Failover: 1× unit jatuh — ConnectX-7 takeover masa
- R4 Restore: backup → bare metal recovery (RPO ≤ 15 min)
- R5 Error simulation: 500 / 403 / 404 / 422 / 429 sweeps mandatory
- R6 Integration: end-to-end Phase C (multi-sistem · webhook signed · idempotency)
Model Pasukan & Tadbir Urus
Penyampaian dan operasi NOVA Server berdasarkan model pasukan tiga peringkat dengan tadbir urus QBR bersama agensi. Setiap kakitangan ALESA tertakluk kepada tapisan latar belakang setanding kakitangan kerajaan.
Susun lapis pasukan
Kitaran tadbir urus
- Harian: pemantauan automatik (Prometheus alerts), on-call Tier 3.
- Mingguan: tinjauan patch, semakan prestasi.
- Bulanan: audit keselamatan, pengesahan backup, laporan klien.
- Suku tahunan: naik taraf model AI (DeepSeek v5, dsb.), QBR dengan agensi.
- Tahunan: audit penuh, semakan kapasiti, perbincangan pembaharuan kontrak.
Tahap Perkhidmatan (SLA)
| KPI | Sasaran | Kaedah Ukur | Penalti Jika Gagal |
|---|---|---|---|
| Ketersediaan platform (uptime) | ≥ 99.5% bulanan (HA Standard+) | Pemantauan automatik (Prometheus) | Kredit 5% bagi setiap 0.5% di bawah |
| Respons insiden P1 (kritikal) | ≤ 30 minit | Cap waktu tiket | Kredit 10% bulanan jika gagal > 2 kali |
| Resolusi insiden P1 | ≤ 4 jam | Cap waktu resolusi | Kredit 15% bulanan |
| Respons insiden P2 (tinggi) | ≤ 2 jam | Cap waktu tiket | Kredit 5% bulanan |
| Resolusi insiden P2 | ≤ 24 jam | Cap waktu resolusi | Kredit 10% bulanan |
| Naik taraf model AI | Suku tahunan, tanpa downtime | Audit deployment | Naik taraf percuma berikutnya jika tergendala |
| Backup data harian | 100% kejayaan | Log backup automatik | Kredit 20% jika kegagalan |
| RTO (Recovery Time Objective) | ≤ 4 jam | Latihan DR suku tahunan | Audit khas + pelan pemulihan |
| RPO (Recovery Point Objective) | ≤ 15 minit | Konfigurasi replikasi | Audit khas + pelan pemulihan |
| Hardware spare swap (Y3-5) | ≤ 48 jam (Dell/HPE ProSupport) | Bundle vendor SLA | Tertakluk SLA vendor |
Keselamatan & Pematuhan
Pematuhan kawal selia
- Akta Perlindungan Data Peribadi 2010 (PDPA) — semua data peribadi disulit, kekal dalam premis klien, tiada pemindahan merentas sempadan.
- MAMPU PSPA — pematuhan dasar keselamatan ICT sektor awam dengan kawalan fizikal pada premis.
- BNM RMiT — institusi kewangan mendapat kawalan teknologi penuh tanpa risiko vendor awan asing.
- MyMIS — kerangka tadbir urus keselamatan maklumat sektor awam.
- MOH compliance — untuk beban kerja healthcare/EMR.
- Audit Negara — audit trail tempatan yang boleh diakses fizikal.
Kawalan keselamatan teknikal
- Penyulitan AES-256 rehat, TLS 1.3 transit antara komponen platform.
- Pengesahan dua-faktor mandatori untuk semua pengguna.
- SSO Keycloak + LDAP/MyDigital ID untuk pengesahan kerajaan.
- Wazuh SIEM untuk pengesanan intrusi masa nyata.
- Fail2Ban + UFW + ClamAV — pertahanan berbilang lapisan.
- Pemisahan persekitaran (Dev, UAT, Pra-Prod, Prod) dengan kawalan akses ketat.
- Imbasan kerentanan suku tahunan (CVE scan + dependency audit).
- Ujian penembusan tahunan oleh pihak ketiga bertauliah.
- Audit trail tidak boleh ubah (append-only log) untuk semua aktiviti.
- Backup geo-redundan bersulit (Restic + Wasabi/Backblaze).
Tadbir urus boleh-bukti — "Bukti, bukan janji."
- Resit jawapan Ed25519 — setiap jawapan AI bertandatangan kriptografi, boleh disahkan sendiri secara luar talian (public key sahaja). Bukti apa yang dijawab, bila, atas sumber apa, di bawah polisi mana.
- ASR terukur + audit-chain tamper-evident — kadar kejayaan serangan (attack-success rate) diukur dan dimeterai dalam rantai-audit tak-boleh-usik — boleh-ulang, tak-boleh-palsu.
- Self-red-team berjadual — sistem uji-serang dirinya ikut jadual (resource-guarded, ter-audit penuh); drift dikesan automatik dan beri amaran.
- Evidence-export gred-regulator — pek bukti untuk PDPA · MAMPU · ISMS dijana terus dari rantai-audit, bertandatangan, sedia untuk juruaudit.
- 319 ujian boleh-ulang pada enjin on-prem — jangan percaya dakwaan, ekstrak dan ulang sendiri.
Pembeza pasaran: setakat semakan kami, tiada platform setanding menawarkan trio ASR ter-audit-chain + resit jawapan boleh-verify-luar-talian + evidence-export regulator sebagai appliance air-gap mampu-milik. (Penjajaran reka bentuk, bukan dakwaan pensijilan — kami terbitkan apa yang terbukti dan apa yang dalam proses.)
Matriks Kawalan Pematuhan — PDPA · MAMPU · BNM RMiT · KKM
Nota penting: Memilih perkakasan on-premises tidak secara automatik membuatkan deployment patuh-undang. NOVA Server menyediakan arsitektur yang memudahkan pematuhan — kawalan akhir bergantung pada agensi melengkapkan dokumentasi, audit, dan tadbir urus organisasi mereka. Matriks di bawah memetakan kawalan teknikal NOVA kepada empat rangka kerja regulasi utama Malaysia.
| Kawalan Teknikal | PDPA 2010 | MAMPU Cloud | BNM RMiT 10.7 | KKM / Health Data |
|---|---|---|---|---|
| Pemastautinan Data (data residency in-perimeter) | ✓ Prinsip 5 | ✓ Sovereign | ✓ TRMF | ✓ Confidentiality |
| Encryption at rest (4TB SE NVMe) | ✓ Prinsip 6 | ✓ Required | ✓ 10.7.2 | ✓ Medical record |
| Encryption in transit (TLS 1.3 + VPN) | ✓ | ✓ | ✓ | ✓ |
| Role-Based Access Control + MFA | ✓ Prinsip 4 | ✓ | ✓ 10.7.4 | ✓ HITL |
| Audit log (prompt + output + akses) | ✓ Prinsip 7 | ✓ | ✓ 10.7.5 | ✓ Audit trail |
| Retention policy + automatic deletion | ✓ Prinsip 3 | Agency-defined | ✓ | 7-yr typical |
| Model governance + version pinning | N/A | Required | ✓ Model risk | HITL mandatory |
| DR + restore drill (RPO ≤ 15 min · RTO ≤ 4 jam) | Recommended | ✓ Required | ✓ Mandatory | ✓ |
| Vulnerability + patch process (quarterly) | ✓ Prinsip 6 | ✓ | ✓ 10.7.3 | ✓ |
| Third-party / vendor support boundary | ✓ | ✓ | ✓ 10.7.6 | Contract-defined |
| No external API egress by default | ✓ Storage | ✓ Sovereign | ✓ Resilience | ✓ Confidentiality |
Positioning vs Dasar Awan Kerajaan (MyGovCloud)
NOVA Server melengkapi — bukan menggantikan — strategi MyGovCloud MAMPU. Positioning yang dicadangkan:
- MyGovCloud: untuk beban kerja awam, sistem citizen-facing, data tahap TERHAD.
- NOVA Server (on-prem): untuk kelas data RAHSIA / RAHSIA BESAR / SULIT di mana inferens AI tidak boleh keluar dari perimeter agensi.
- Hybrid: RAG indexing on-prem (data sensitif), summarization on-prem, hanya output bersih (non-PII) ke MyGovCloud jika perlu shared service.
Use Case per Agensi (Data yang Kekal On-Prem)
Pengurusan Insiden & Eskalasi
Matriks keutamaan insiden
| Tahap | Definisi | Contoh | Respons |
|---|---|---|---|
| P1 Kritikal | Platform tidak berfungsi, semua aplikasi terjejas | Server padam, storage korup, GPU failure total | ≤ 30 min respons · ≤ 4 jam resolusi · Tier 0/1 escalation |
| P2 Tinggi | Aplikasi utama terjejas atau prestasi degraded | GovERP lambat, AI inference timeout, login intermittent | ≤ 2 jam respons · ≤ 24 jam resolusi · Tier 2 |
| P3 Sederhana | Aplikasi individu, ada workaround | Bug skrin spesifik, eksport PDF tergendala, OCR akurasi rendah | ≤ 8 jam respons · ≤ 5 hari resolusi · Tier 3 |
| P4 Rendah | Permintaan kosmetik atau peningkatan kecil | Label salah eja, tooltip tambahan, susunan UI | ≤ 2 hari respons · backlog 30 hari · Tier 3 |
Rantaian eskalasi
- Tier 1 — AI Commander Klien (jam 0-1): triage, basic restart, log collection, eskalasi ke ALESA.
- Tier 2 — ALESA Remote Engineer (jam 1-4): diagnosis mendalam, root-cause analysis, mitigasi via SSH.
- Tier 3 — ALESA On-Site Engineer (jam 4-24): deployment ke premis untuk isu hardware atau konfigurasi mendalam.
- Tier 0 — Pengarah Projek / Pengasas (jam 0+ untuk kritikal): pemberitahuan stakeholder, koordinasi sumber tambahan, komunikasi rasmi.
Pelan Pelaksanaan — 8 Minggu Standard
| Minggu | Aktiviti Utama | Penyampaian |
|---|---|---|
| 1 | Site survey, finalisasi spec, perolehan perkakasan dari vendor partner (Dell/HPE/Lenovo) | Sign-off spec + PO ke vendor |
| 2 | Burn-in perkakasan + pra-instal ALESA stack di pusat staging Leqoe | Server siap dengan OS + container runtime + monitoring |
| 3 | Penghantaran ke premis klien + pemasangan fizikal + konfigurasi rangkaian | Server hidup di premis, terhubung dengan rangkaian klien |
| 4 | Konfigurasi OS, security hardening, SSO setup, firewall rules | Platform keras dan patuh kawal selia |
| 5 | Deployment model AI berbilang tier + tuning awal untuk konteks klien | AI stack berfungsi, inference dah lulus benchmark |
| 6 | Deployment aplikasi ALESA (GovERP, Legacy Bridge, dsb. mengikut skop klien) | Aplikasi tersedia untuk UAT |
| 7 | UAT bersama pasukan klien + AI Commander training kickoff (5 hari) | Sign-off UAT + 2 orang AI Commander bertauliah |
| 8 | Cutover formal + handover dokumentasi + hyper-care 90 hari bermula | Platform LIVE, kontrak penyelenggaraan aktif |
Catatan: Untuk tier Ministry (multi-agency / hybrid rack) dengan beban kerja yang lebih kompleks, tempoh pelaksanaan boleh dilanjutkan kepada 12-16 minggu. Untuk tier Pilot dengan satu aplikasi sahaja, tempoh boleh dipendekkan kepada 5-6 minggu.
Tier & Pelaburan
NOVA Server tersedia dalam 4 tier produk untuk menyesuaikan dengan saiz organisasi dan kompleksiti beban kerja. Setiap tier all-in-one — termasuk perkakasan, pra-instal ALESA stack, model AI berbilang, latihan AI Commander, dan termasuk penyelenggaraan tahunan.
Struktur harga: Tahun 1 = harga penuh pakej · Tahun ke-2 dan seterusnya = diskaun 40% setahun · skala kapasiti dengan menambah unit perkakasan. Harga ditunjuk ialah harga pengenalan untuk tempoh promosi pelancaran.
Kapasiti: 1-2 beban kerja · ~20-30 pengguna · 200B params local
Prestasi: Llama 70B @ 20-30 tok/s · Whisper 10× realtime
Maintenance: Termasuk penyelenggaraan tahunan
Kapasiti: 3-5 beban kerja · ~100 pengguna · failover automatik
Prestasi: Llama 70B HA · DeepSeek 235B Q4 capable · multi-agent fleet
Maintenance: Termasuk penyelenggaraan tahunan
Kapasiti: 6-8 beban kerja · ~500 pengguna · DR-ready
Prestasi: DeepSeek 235B prod · concurrent 400+ AML/transactions · Whisper 60+ streams
Maintenance: Termasuk penyelenggaraan tahunan
Kapasiti: 10+ beban kerja · multi-agency · staging+prod isolated
Prestasi: Multi-zone HA · audit node · dedicated sensitive workloads · concurrency tanpa had
Maintenance: Termasuk penyelenggaraan tahunan
Semua harga ialah harga pengenalan all-in-one — termasuk perkakasan, ALESA Framework, model AI berbilang, latihan AI Commander, dan termasuk penyelenggaraan tahunan. Tiada yuran penyelenggaraan berasingan. Tahun ke-4 dan seterusnya disambung pada kadar diskaun 40% (RM 125,000/tahun per unit).
TCO 3 Tahun (NOVA Standard · 2× unit · contoh)
| Komponen | RM |
|---|---|
| Pakej Tahun 1 (perkakasan 2× unit + deployment + ALESA stack + operasi) | 400,000 |
| Tahun 2 (diskaun 40%) | 250,000 |
| Tahun 3 (diskaun 40%) | 250,000 |
| Penyelenggaraan tahunan + naik taraf model AI suku tahunan | Termasuk |
| Latihan AI Commander 2 orang | Termasuk |
| Jumlah TCO 3 tahun (all-in · harga pengenalan) | RM 900,000 |
Tahun ke-4 dan seterusnya: RM 250,000/tahun (diskaun 40% kekal). Berbanding penggunaan cloud AI sahaja untuk pasukan 5+ pembangun aktif (RM 1.2M+ setahun recurring forever), NOVA Server memberikan kestabilan kos jangka panjang dan kawalan total ke atas infrastruktur AI organisasi anda.
TCO 3-Tahun: NOVA EdgeXpert vs Cloud API
Scenario kiraan: 10-orang pasukan pembangun aktif AI, 8 jam/hari × 5 hari × 52 minggu × 3 tahun. Workload mix: Llama 70B chatbot, Qwen 32B code co-pilot, Whisper transkripsi, embeddings RAG. Kos cloud diambil dari pricing umum awam Mei 2026.
| Komponen | NOVA EdgeXpert (3 tahun) | Cloud API (3 tahun) |
|---|---|---|
| Pakej all-in NOVA Standard 2× unit, 3 tahun (perkakasan + ALESA stack + penyelenggaraan tahunan + latihan) | RM 900,000 | — |
| Kuasa elektrik (~150W × 8h × 260 hari × 3 thn × RM0.38/kWh) | RM ~360 | — |
| Penyejukan + rak (pro-rated 3 thn) | RM ~1,200 | — |
| Claude Sonnet API (chat + RAG, 10 org × 60K tok/hari · setahun) | — | RM ~58,500 |
| OpenAI GPT-4o (code co-pilot, 10 org × 25K tok/hari · setahun) | — | RM ~39,000 |
| Whisper API (transkripsi 1h/org/hari · setahun) | — | RM ~46,800 |
| Bedrock embedding + storage + egress (setahun) | — | RM ~35,000 |
| Tahun ke-2 dan ke-3 (recurring × 2 · RM ~179,300/tahun) | (termasuk dalam pakej) | RM ~358,600 |
| JUMLAH 3-TAHUN | RM ~901,560 | RM ~537,900 |
| Catatan kos: NOVA TCO termasuk penyelenggaraan tahunan penuh + naik taraf model AI suku tahunan + latihan AI Commander. Cloud API hanya inferens — tiada framework, tiada sokongan, tiada ALESA stack, tiada agent fleet, tiada audit log compliance, tiada DR. Harga NOVA = harga pengenalan. | ||
Nilai NOVA Yang TIDAK Boleh Dibandingkan Wang Sahaja
Bottom line: NOVA bukan sentiasa "lebih murah dari cloud" dari segi tunai langsung — untuk tempoh 3 tahun ia setanding hingga sedikit lebih tinggi berbanding cloud API tulen, tetapi memberikan kedaulatan + pematuhan + stack + sokongan yang tidak dijual oleh penyedia cloud. Untuk pasukan 10+ pembangun atau workload sensitif, NOVA jelas pilihan rasional.
Andaian & Kebergantungan
Andaian projek
- Premis klien mempunyai ruang fizikal sesuai (bilik server berkunci, jubin lantai, kabel rangkaian).
- Bekalan elektrik mencukupi (minimum 16A 220V, ideal redundant 2× source).
- Penyaman udara mencukupi (server room target 18-22°C, RH 40-60%).
- Sambungan internet stabil (Unifi/UMobile/TM Fiber, ideal redundant 2× ISP).
- Klien sediakan 2 orang kakitangan untuk pensijilan AI Commander.
- Akses fizikal untuk pasukan ALESA semasa pemasangan dan penyelenggaraan.
- Aplikasi klien yang ingin dihos boleh dijalankan dalam container Docker.
Kebergantungan luar
- Ketersediaan stok perkakasan dari vendor (Dell/HPE/Lenovo MY) — lead time biasanya 2-4 minggu.
- Lesen Microsoft 365 / Google Workspace klien untuk SSO integrasi.
- Pensijilan MAMPU PSPA untuk klien kerajaan persekutuan.
- Kelulusan Bahagian Audit Dalam klien untuk konfigurasi audit trail.
- Persetujuan Jawatankuasa ICT klien untuk seni bina dan keselamatan.
- Pematuhan vendor model AI sumber terbuka (DeepSeek, Qwen, Llama) dengan terma lesen tempatan.
Daftar Risiko
| Risiko | Kebarangkalian | Impak | Mitigasi |
|---|---|---|---|
| Eksposur modal perolehan perkakasan | Tinggi | Sederhana | 50% deposit klien sebelum PO + terma vendor 60 hari |
| Perkakasan menjadi usang dalam 3 tahun | Sederhana | Tinggi | Over-provision spec 30% Day 1 + opsyen naik taraf perkakasan pada pembaharuan |
| Beban penyelenggaraan meningkat dengan skala | Tinggi | Tinggi | Model sokongan 3-tier + AI Commander cert offload Tier 1 |
| AI Commander satu klien berhenti (single point of failure) | Tinggi | Tinggi | Kontrak mandatori 2 orang bertauliah (primary + backup) |
| Isu tapak (kuasa, penyejukan, rangkaian) | Sederhana | Tinggi | Pre-deploy site survey + UPS + 4G/5G fallback |
| Model AI menjadi usang (DeepSeek v5 release) | Tinggi | Rendah | Naik taraf suku tahunan dalam skop penyelenggaraan |
| Kerosakan perkakasan Tahun 2-3 | Sederhana | Tinggi | Bundle Dell/HPE 3-yr ProSupport + spare swap rapid |
| Jurang insurans | Rendah | Tinggi | Allianz/Tokio Marine equipment cover ~RM 2-5k/tahun |
| Perubahan dasar MAMPU/regulator | Sederhana | Tinggi | Track dasar MAMPU + adaptasi cepat senibina |
| Pesaing meniru model | Sederhana | Sederhana | ALESA Framework IP + 2-tahun head start + Doc Zam endorsement |
| Perubahan lesen model AI sumber terbuka | Rendah | Tinggi | Kekal 3+ model alternatif per tier (DeepSeek + Qwen + Llama) |
| Klien breach semasa tempoh 3 tahun | Rendah | Kritikal | Liability cap dalam kontrak + insurans cyber + audit trail tempatan |
| Harga cloud AI jatuh (commoditize) | Sederhana | Sederhana | Cerita kedaulatan kekal; kos hanya 1 dari 7 pillar nilai |
| Kekurangan jurutera pakar | Tinggi | Sederhana | Pipeline latihan via UniKL/UTM partnership + ALESA Academy |
| Risiko terlebih-tuntut prestasi (overclaim) — keupayaan 200B/405B params bergantung pada quantization, context length, concurrency | Tinggi | Tinggi | Publish jadual benchmark per workload · UAT acceptance criteria · TRACE Gate mandatory · elak "AI tanpa had" claims |
| Risiko mispositioning pematuhan — on-prem ≠ auto-compliant; agensi mungkin anggap NOVA secara automatik patuh PDPA/BNM | Sederhana | Kritikal | Compliance control matrix dalam setiap proposal · DR drill mandatory · agency-specific approval workflow · onboarding ckecklist |
| Risiko rantaian bekalan EdgeXpert + lifecycle DGX OS — ketersediaan MSI EdgeXpert/DGX Spark, firmware updates, kompatibiliti ARM, ganti unit tempatan | Sederhana | Tinggi | Hot spare unit included Tier Pro+ · vendor warranty 3-yr · tested restore image · ARM compatibility checklist · quarterly patch window · alternate hardware path (DGX Workstation fallback) |
Kesimpulan
ALESA NOVA Server mewakili evolusi semula jadi dalam pendekatan pengkomputeran enterprise untuk Malaysia. Dengan menggabungkan perkakasan komoditi berkualiti, model AI sumber terbuka kelas premium, kerangka orkestra ALESA yang terbukti, dan komitmen penyelenggaraan 3 tahun, kami menyediakan platform yang memberikan agensi dan organisasi Malaysia kedaulatan teknologi yang sebenar tanpa kompromi pada kualiti.
Kami percaya masa depan teknologi negara terletak pada keseimbangan antara inovasi global (model AI sumber terbuka terbaik dunia) dan kawalan tempatan (perkakasan, data, dan kepakaran milik sendiri). NOVA Server menyediakan keseimbangan itu dalam satu produk yang boleh dipasang minggu depan dalam pejabat anda.
Kami berbesar hati untuk berbincang dengan organisasi yang berminat. Lawat showcase NOVA Server Reference Lab di pejabat ALESA Leqoe untuk mengalami platform ini secara langsung.
Sedia untuk kedaulatan AI anda sendiri?
Lawat NOVA Server Reference Lab di pejabat ALESA Leqoe, atau minta sesi cadangan khusus untuk skop organisasi anda. Harga pengenalan terhad untuk tempoh pelancaran.
Rujukan
- ALESA Framework Edisi Nova Server
- ALESA NOVA Server Product Doctrine v1 — dokumen reka bentuk lengkap (17 seksyen)
- ALESA GovERP Doctrine v1 — aplikasi utama atas platform NOVA
- ALESA Legacy Modernization Doctrine v1 — strategi modenisasi sistem warisan
- ALESA Code Quality Doctrine v1 + Grandmaster Coder Doctrine v1
- PCEB Gate v4 "Cognitive Gate" — disiplin pencegahan drift 95%
- ALESA Gov Proposal Format Doctrine v1 (Doc Zam standard)
- Dasar Cloud First MAMPU 2021 + pindaan terkini
- BNM Risk Management in Technology (RMiT) guidelines
- Akta PDPA 2010 + pindaan 2024
- Model spec: DeepSeek v4.0, Qwen 2.5, Llama 3.1, Mistral Large 2
- Reference: Oracle Exadata, IBM Watson on-prem, NVIDIA DGX, Dell APEX
Penghargaan
Format dan struktur cadangan produk ini berdasarkan piawaian yang dirintis oleh Dr Shuhaizam Zain (Doc Zam), Penasihat Strategik ALESA. Pendekatan tadbir urus dengan model staffing Tier 1/2/3, SLA berasaskan penalti, daftar risiko, dan andaian/kebergantungan eksplisit adalah hasil bimbingan profesional beliau. Vision asal produk NOVA Server muncul daripada perbincangan strategik antara Pengasas Pengasas ALESA dengan rakan industri pada Mei 2026 berkenaan keperluan pasaran untuk alternatif cloud AI di Malaysia.