Czerwiec 25, 2023 15 min

MLIR - jak nowy framework Google zmienia grę w tworzeniu i optymalizacji kompilatorów

Treść artykułu:

Czym jest MLIR i jak działa?
MLIR w Pythonie
Dlaczego MLIR jest przydatny?
Zastosowanie MLIR
MLIR w projektach open source
MLIR, nowy assembler?
Podsumowanie

Strona oficjalna projektu MLIR: https://mlir.llvm.org/

Artykuł o MLIR: https://arxiv.org/abs/2002.11054

Czym jest MLIR i jak działa?

MLIR (Multi-Level Intermediate Representation) to framework do optymalizacji i przetwarzania kodu programów dla różnych architektur sprzętowych. Framework ten jest oparty na modelu hierarchicznej reprezentacji, który umożliwia przetwarzanie kodu na różnych poziomach abstrakcji.

Na najniższym poziomie hierarchii znajduje się reprezentacja instrukcji procesora, której kod jest bezpośrednio wykonywany na urządzeniu. Na wyższym poziomie znajdują się reprezentacje kodu assemblera, języka maszynowego, kodu pośredniego i kodu źródłowego. MLIR umożliwia przetwarzanie kodu na każdym z tych poziomów, co umożliwia dostosowanie go do różnych platform sprzętowych.

Działanie MLIR opiera się na modularnej strukturze, która umożliwia programistom dodawanie nowych transformacji i optymalizacji do frameworku. Moduły te są nazywane "dialects" i umożliwiają dostosowanie MLIR do różnych języków programowania i architektur sprzętowych.

MLIR umożliwia programistom tworzenie programów w taki sposób, aby działały one szybciej i wydajniej na różnych urządzeniach. Dzięki MLIR możliwe jest na przykład automatyczne dopasowanie kodu programu do specyficznej architektury sprzętowej lub wybór najlepszego algorytmu w zależności od konkretnego przypadku.

MLIR składa się z różnych narzędzi i bibliotek, takich jak kompilatory, optymalizatory i symulatory, które umożliwiają programistom przetwarzanie i optymalizowanie kodu dla różnych architektur sprzętowych. MLIR jest dostępny jako otwarte oprogramowanie (open source), co umożliwia jego rozwijanie i modyfikowanie przez społeczność programistów.

Prosty kod MLIR w Pythonie

Aby zastosować MLIR w Pythonie, można skorzystać z biblioteki PyMLIR. PyMLIR jest interfejsem Pythona do MLIR i pozwala na łatwe przetwarzanie i optymalizację kodu programów w MLIR. Poniżej przedstawiam przykład użycia PyMLIR w Pythonie:

import mlir
import mlir_runner

# Definiowanie MLIR kodu
mlir_code = '''
func @add(%arg0: i32, %arg1: i32) -> i32 {
  %sum = addi %arg0, %arg1 : i32
  return %sum : i32
}
'''

# Kompilacja MLIR kodu
module = mlir.parse_string(mlir_code)
module.verify()

# Uruchomienie funkcji 'add' z MLIR
engine = mlir_runner.create_engine_from_module(module)
result = engine.invoke('add', 2, 3)
print(result)  # Wypisze '5'

W tym przykładzie, definiujemy MLIR kod funkcji add w zmiennej mlir_code. Następnie kompilujemy ten kod przy użyciu mlir.parse_string() i tworzymy silnik wykonawczy przy użyciu mlir_runner.create_engine_from_module(). W końcu, wywołujemy funkcję add przy użyciu engine.invoke() i wyświetlamy wynik w konsoli.

W ten sposób, korzystając z mlir_runner, możemy wywoływać funkcje z MLIR w Pythonie i innych językach programowania.

Więcej o bibliotece pyMLIR można dowiedzieć się tutaj: https://github.com/spcl/pymlir.

Dlaczego MLIR jest przydatny?

MLIR (Multi-Level Intermediate Representation) jest przydatny z kilku powodów:

Optymalizacja kodu programów - MLIR pozwala na automatyczną optymalizację kodu programów i dostosowanie go do różnych platform sprzętowych, co pozwala na uzyskanie wyższej wydajności i szybkości działania programów.
Łatwe przenoszenie kodu programów - MLIR pozwala na łatwe przenoszenie kodu programów między różnymi platformami sprzętowymi, co pozwala na tworzenie programów, które działają na różnych urządzeniach.
Integracja z istniejącymi projektami - MLIR może być łatwo zintegrowany z istniejącymi projektami, takimi jak LLVM, TensorFlow i inne, co pozwala na wykorzystanie wszystkich funkcji i możliwości tych projektów, a jednocześnie korzystanie z optymalizacji i przetwarzania kodu programów w MLIR.
Wspieranie różnych języków programowania - MLIR wspiera różne języki programowania, takie jak C++, Python, Swift i inne, co pozwala na tworzenie programów w ulubionym języku programowania i ich optymalizację przy użyciu MLIR.
Łatwe dostosowanie do zmieniających się potrzeb - MLIR jest projektowany tak, aby był elastyczny i łatwo dostosowywalny do zmieniających się potrzeb programistów i różnych platform sprzętowych.

Ostatecznie, MLIR jest przydatny dla programistów, którzy chcą uzyskać wyższą wydajność i szybkość działania swoich programów, a jednocześnie chcą łatwo przenosić swoje programy między różnymi platformami sprzętowymi i korzystać z różnych języków programowania.

Zastosowanie MLIR

Przetwarzanie danych w sieciach neuronowych - MLIR może być stosowany do optymalizacji kodu programów w dziedzinie uczenia maszynowego. Dzięki temu sieci neuronowe mogą działać szybciej i wydajniej na różnych urządzeniach.
Symulacje fizyczne - może być używany do przetwarzania kodu programów w dziedzinie symulacji fizycznych. Dzięki temu symulacje mogą działać szybciej i na różnych platformach sprzętowych.
Przetwarzanie obrazów i dźwięku - MLIR może być stosowany do przetwarzania kodu programów w dziedzinie przetwarzania obrazów i dźwięku. Dzięki temu programy te mogą działać szybciej i wydajniej na różnych urządzeniach.
Projektowanie i optymalizacja kompilatorów - MLIR może być stosowany do projektowania i optymalizacji kompilatorów dla różnych języków programowania i architektur sprzętowych.
Programowanie niskopoziomowe - MLIR może być stosowany do programowania niskopoziomowego, takiego jak sterowanie urządzeniami peryferyjnymi, w tym do sterowania robotami i maszynami przemysłowymi.

W sumie, MLIR znajduje zastosowanie w różnych dziedzinach programowania, gdzie ważna jest optymalizacja i przetwarzanie kodu programów na różnych platformach sprzętowy

MLIR zastosowanie w projektach

MLIR znalazł zastosowanie w takich projektach jak:

TensorFlow - https://www.tensorflow.org/mlir?hl=pl
LLVM - https://mlir.llvm.org/
XLA (Accelerated Linear Algebra)- biblioteka do przyspieszania obliczeń numerycznych - https://www.tensorflow.org/xla?hl=pl
ONNX (Open Neural Network Exchange) - otwarty format do wymiany modeli uczenia maszynowego. https://onnx.ai/

MLIR, nowy assembler?

MLIR to nie jest bezpośrednio assembler, ale język pośredni służący do optymalizacji kodu programów na różnych platformach sprzętowych. MLIR może być porównywany do assemblera, ponieważ zarówno MLIR, jak i assembler służą do tłumaczenia kodu programów na kod wykonywalny na danym sprzęcie.

Jednak MLIR jest znacznie bardziej elastyczny i wydajny niż tradycyjny assembler. MLIR pozwala na automatyczną optymalizację kodu programów i dostosowanie go do różnych platform sprzętowych, co oznacza, że programista nie musi ręcznie optymalizować kodu dla każdej platformy.

Ostatecznie, MLIR może być używany w połączeniu z assemblerem do optymalizacji kodu programów dla różnych platform sprzętowych. W ten sposób programiści mogą osiągnąć najlepsze wyniki wydajnościowe dla swoich programów.

Podsumowanie

MLIR to wielopoziomowa reprezentacja pośrednia kodu programów, która jest projektowana tak, aby ułatwić optymalizację i przetwarzanie kodu programów na różnych platformach sprzętowych. MLIR jest łatwo zintegrowalny z istniejącymi projektami, takimi jak LLVM i TensorFlow, i może być używany z różnymi językami programowania, takimi jak C++, Python i Swift. Dzięki MLIR programiści mogą osiągać wyższą wydajność i szybkość działania swoich programów, a jednocześnie łatwo przenosić je między różnymi platformami sprzętowymi.