Блочно-диагональный подход к неотрицательной факторизации разреженных лингвистических матриц и тензоров сверхбольшой размерности с использованием латентного распределения Дирихле
Описаны алгоритмы неотрицательной факторизации разреженных матриц и тензоров. Рассмотрено использование латентного распределения Дирихле для приведения матриц и тензоров к блочно-диагональной форме для параллелизации вычислений и ускорения неотрицательной факторизации лингвистических матриц и тензор...
Gespeichert in:
| Veröffentlicht in: | Кибернетика и системный анализ |
|---|---|
| Datum: | 2018 |
| Hauptverfasser: | , , |
| Format: | Artikel |
| Sprache: | Russian |
| Veröffentlicht: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2018
|
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/161443 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Блочно-диагональный подход к неотрицательной факторизации разреженных лингвистических матриц и тензоров сверхбольшой размерности с использованием латентного распределения Дирихле / А.В. Анисимов, А.А. Марченко, Э.М. Насиров // Кибернетика и системный анализ. — 2018. — Т. 54, № 6. — С. 3-10. — Бібліогр.: 15 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| Zusammenfassung: | Описаны алгоритмы неотрицательной факторизации разреженных матриц и тензоров. Рассмотрено использование латентного распределения Дирихле для приведения матриц и тензоров к блочно-диагональной форме для параллелизации вычислений и ускорения неотрицательной факторизации лингвистических матриц и тензоров сверхбольшой размерности. Предложенная модель позволяет дополнять модели новыми данными без необходимости выполнять неотрицательную факторизацию всего сверхбольшого тензора заново.
Описано алгоритми невід’ємної факторизації розріджених матриць і тензорів. Розглянуто використання латентного розподілу Діріхле для приведення матриць і тензорів до блочно-діагональної форми для паралелізації обчислень і прискорення невід’ємної факторизации лінгвістичних матриць і тензорів надвеликої розмірності. За допомогою запропонованої моделі можна доповнювати моделі новими даними без необхідності знову виконувати невід’ємну факторизацію всього надвеликого тензора.
In this paper, algorithms for the non-negative factorization of sparse matrices and tensors, a popular technology in artificial intelligence in general and in computer linguistics in particular, are described. It is proposed to use the latent Dirichlet distribution to reduce matrices and tensors to block-diagonal form for parallelizing computations and accelerating the non-negative factorization of linguistic matrices and tensors of extremely large dimension. The proposed model also allows the models to be supplemented with new data without having to perform non-negative factorization of the entire super-large tensor anew from the very beginning.
|
|---|---|
| ISSN: | 1019-5262 |