IBM CodeNet to 14 mln próbek kodu w 55 językach programowania

Projekt IBM CodeNet powstał, aby zbadać, czy sztuczna inteligencja jest w stanie odciążyć programistów w ich żmudnej i mozolnej pracy. IBM przygotował aż 14 milionów próbek kodu w wielu różnych językach programowania.

Projekt IBM CodeNet

Projekt IBM CodeNet zawiera nie tylko wspomniane 14 mln próbek kodu. Każda z nich odnosi się do rozwiązania jednego z 4000 najczęściej spotykanych problemów w kodowaniu. Próbki wywodzą się z 55 różnych języków programowania, w tym C++, Cobol, Fortran, Go, Java, Pascal i Python.

Każda dodatkowo jest opatrzona odpowiednim zestawem informacji, w którym znajdują się takie dane jak rozmiar, ślad pamięci, czas wykonania i status.

Zastosowanie

Zbiór próbek kodu może być wykorzystywany do trenowania modeli uczenia maszynowego w różnych zadaniach. Bogaty zbiór adnotacji dodanych pozwala zastosować go do różnych zadań. Mogą to być modele uczenia maszynowego w zadaniach programistycznych, tłumaczenia kodu z jednego języka programowania na inny. Może to pomóc w przypadku, gdy oprogramowanie zostało przygotowane w starszym języku programowania, a właściciel chce, aby było ono dostępne w nowej odsłonie i dostępne dla nowego pokolenia programistów.

Do tej pory podejmowano wiele prób przygotowania tego typu zbiorów próbek kodu, ale zazwyczaj dotyczyły one konkretnych problemów czy zadań. IBM CodeNet jest bardzo uniwersalnym zbiorem i może okazać się niezwykle pomocny dla wielu programistów.

Jest to kolejna inicjatywa IBM, po konkursach i programach certyfikujących dla programistów kwantowych, które organizowała ta firma wcześniej. Jesteśmy pod wrażeniem działań IBM mających na celu wspieranie środowiska programistycznego na całym świecie.

Źródło: IBM, GitHub

Dodaj komentarz