<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://doc.ruscomtech.ru/index.php?action=history&amp;feed=atom&amp;title=NVIDIA_NIM</id>
	<title>NVIDIA NIM - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://doc.ruscomtech.ru/index.php?action=history&amp;feed=atom&amp;title=NVIDIA_NIM"/>
	<link rel="alternate" type="text/html" href="https://doc.ruscomtech.ru/index.php?title=NVIDIA_NIM&amp;action=history"/>
	<updated>2026-04-21T10:28:05Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.36.1</generator>
	<entry>
		<id>https://doc.ruscomtech.ru/index.php?title=NVIDIA_NIM&amp;diff=6158&amp;oldid=prev</id>
		<title>IKuznetsov в 15:57, 4 февраля 2026</title>
		<link rel="alternate" type="text/html" href="https://doc.ruscomtech.ru/index.php?title=NVIDIA_NIM&amp;diff=6158&amp;oldid=prev"/>
		<updated>2026-02-04T15:57:16Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ru&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Предыдущая&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;Версия 15:57, 4 февраля 2026&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l8&quot;&gt;Строка 8:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Строка 8:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;После этого добавьте следующие аннотации к вашим развертываниям '''NVIDIA NIM''':&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;После этого добавьте следующие аннотации к вашим развертываниям '''NVIDIA NIM''':&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;lt;code&amp;gt;metrics.&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;dynatrace&lt;/del&gt;.com/scrape: &amp;quot;true&amp;quot;&amp;lt;/code&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;lt;code&amp;gt;metrics.&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;astromkey&lt;/ins&gt;.com/scrape: &amp;quot;true&amp;quot;&amp;lt;/code&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;lt;code&amp;gt;metrics.&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;dynatrace&lt;/del&gt;.com/port: &amp;quot;8000&amp;quot;&amp;lt;/code&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;* &amp;lt;code&amp;gt;metrics.&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;astromkey&lt;/ins&gt;.com/port: &amp;quot;8000&amp;quot;&amp;lt;/code&amp;gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;br/&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;=== OpenTelemetry Collector ===&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;=== OpenTelemetry Collector ===&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;

&lt;!-- diff cache key ka_db:diff::1.12:old-6157:rev-6158 --&gt;
&lt;/table&gt;</summary>
		<author><name>IKuznetsov</name></author>
	</entry>
	<entry>
		<id>https://doc.ruscomtech.ru/index.php?title=NVIDIA_NIM&amp;diff=6157&amp;oldid=prev</id>
		<title>IKuznetsov: Новая страница: «'''NVIDIA NIM''' (NVIDIA Inference Microservices) — это набор микросервисов, которые ускоряют развертывание б...»</title>
		<link rel="alternate" type="text/html" href="https://doc.ruscomtech.ru/index.php?title=NVIDIA_NIM&amp;diff=6157&amp;oldid=prev"/>
		<updated>2026-02-04T15:57:02Z</updated>

		<summary type="html">&lt;p&gt;Новая страница: «&amp;#039;&amp;#039;&amp;#039;NVIDIA NIM&amp;#039;&amp;#039;&amp;#039; (NVIDIA Inference Microservices) — это набор микросервисов, которые ускоряют развертывание б...»&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;'''NVIDIA NIM''' (NVIDIA Inference Microservices) — это набор микросервисов, которые ускоряют развертывание базовых моделей в любом облаке или центре обработки данных, оптимизируя инфраструктуру '''ИИ''' для повышения эффективности и экономичности, а также снижая затраты на оборудование и эксплуатацию.&lt;br /&gt;
&lt;br /&gt;
== Включить мониторинг ==&lt;br /&gt;
&lt;br /&gt;
=== Kubernetes ===&lt;br /&gt;
Для мониторинга вашего кластера следуйте руководству по настройке [[Настройка Ключ-АСТРОМ в Kubernetes|Ключ-АСТРОМ в Kubernetes]].&lt;br /&gt;
&lt;br /&gt;
После этого добавьте следующие аннотации к вашим развертываниям '''NVIDIA NIM''':&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;code&amp;gt;metrics.dynatrace.com/scrape: &amp;quot;true&amp;quot;&amp;lt;/code&amp;gt;&lt;br /&gt;
* &amp;lt;code&amp;gt;metrics.dynatrace.com/port: &amp;quot;8000&amp;quot;&amp;lt;/code&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== OpenTelemetry Collector ===&lt;br /&gt;
Для развертывания сборщика следуйте руководству по установке [[Развертывание Collector|OpenTelemetry Collector]]. При следующей конфигурации '''Collector''' будет собирать метрики '''ИИ''' каждые 10 секунд с конечной точки &amp;lt;code&amp;gt;&amp;lt;NIM-endpoint&amp;gt;:8000&amp;lt;/code&amp;gt;.&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|receivers:&lt;br /&gt;
&lt;br /&gt;
  prometheus:&lt;br /&gt;
&lt;br /&gt;
    config:&lt;br /&gt;
&lt;br /&gt;
      scrape_configs:&lt;br /&gt;
&lt;br /&gt;
      - job_name: nim-metrics&lt;br /&gt;
&lt;br /&gt;
        scrape_interval: 10s&lt;br /&gt;
&lt;br /&gt;
        honor_labels: false&lt;br /&gt;
&lt;br /&gt;
        static_configs:&lt;br /&gt;
&lt;br /&gt;
          - targets:&lt;br /&gt;
&lt;br /&gt;
              - [&amp;quot;&amp;lt;NIM-endpoint&amp;gt;:8000&amp;quot;]&lt;br /&gt;
&lt;br /&gt;
processors:&lt;br /&gt;
&lt;br /&gt;
  cumulativetodelta:&lt;br /&gt;
&lt;br /&gt;
    max_staleness: 25h&lt;br /&gt;
&lt;br /&gt;
extensions:&lt;br /&gt;
&lt;br /&gt;
  health_check:&lt;br /&gt;
&lt;br /&gt;
exporters:&lt;br /&gt;
&lt;br /&gt;
  otlphttp:&lt;br /&gt;
&lt;br /&gt;
    endpoint: ${env:DT_ENDPOINT}&lt;br /&gt;
&lt;br /&gt;
    headers:&lt;br /&gt;
&lt;br /&gt;
      Authorization: &amp;quot;Api-Token ${env:DT_API_TOKEN}&amp;quot;&lt;br /&gt;
&lt;br /&gt;
service:&lt;br /&gt;
&lt;br /&gt;
  extensions: [health_check]&lt;br /&gt;
&lt;br /&gt;
    metrics:&lt;br /&gt;
&lt;br /&gt;
      receivers: [prometheus]&lt;br /&gt;
&lt;br /&gt;
      processors: [cumulativetodelta]&lt;br /&gt;
&lt;br /&gt;
      exporters: [otlphttp]&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== Spans ==&lt;br /&gt;
Для '''GenAI Spans''' доступны следующие атрибуты.&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
!Атрибут&lt;br /&gt;
!Тип&lt;br /&gt;
!Описание&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.completion.0.content&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Полный ответ, полученный от модели GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.completion.0.content_filter_results&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Результаты фильтрации ответа, полученного от модели GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.completion.0.finish_reason&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Причина, по которой модель GenAI перестала выпускать токены.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.completion.0.role&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Роль, используемая моделью GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.openai.api_base&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Адрес сервера GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.openai.api_version&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Версия API GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.openai.system_fingerprint&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Отпечаток пальца ответа, сгенерированного моделью GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.prompt.0.content&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Полный текст запроса, отправленного модели GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.prompt.0.role&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Настройка роли для запроса GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.prompt.prompt_filter_results&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Результаты фильтрации запроса, отправленного модели GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.request.max_tokens&amp;lt;/code&amp;gt;&lt;br /&gt;
|integer&lt;br /&gt;
|Максимальное количество токенов, которое модель генерирует для запроса.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.request.model&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Название модели GenAI, к которой направляется запрос.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.request.temperature&amp;lt;/code&amp;gt;&lt;br /&gt;
|double&lt;br /&gt;
|Температурный параметр для запроса GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.request.top_p&amp;lt;/code&amp;gt;&lt;br /&gt;
|double&lt;br /&gt;
|Параметр выборки top_p для запроса GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.response.model&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Название модели, которая сгенерировала ответ.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.system&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Продукт GenAI, идентифицированный с помощью клиентского или серверного программного обеспечения.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.usage.completion_tokens&amp;lt;/code&amp;gt;&lt;br /&gt;
|integer&lt;br /&gt;
|Количество токенов, использованных в ответе GenAI (завершение).&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.usage.prompt_tokens&amp;lt;/code&amp;gt;&lt;br /&gt;
|integer&lt;br /&gt;
|Количество токенов, использованных во входных данных GenAI (подсказке).&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;llm.request.type&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Тип выполняемой операции.&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== Метрики ==&lt;br /&gt;
Будут доступны следующие метрики:&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
!Метрическая система&lt;br /&gt;
!Тип&lt;br /&gt;
!Единица&lt;br /&gt;
!Описание&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;e2e_request_latency_seconds&amp;lt;/code&amp;gt;&lt;br /&gt;
|histoGrailm&lt;br /&gt;
|s&lt;br /&gt;
|Гистограмма задержки сквозного запроса в секундах.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;generation_tokens_total&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Количество обработанных токенов генерации&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gpu_cache_usage_perc&amp;lt;/code&amp;gt;&lt;br /&gt;
|gauge&lt;br /&gt;
|integer&lt;br /&gt;
|Использование кэша ключ-значение графического процессора. 1 означает 100-процентное использование.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;num_request_max&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Максимальное количество одновременно выполняющихся запросов&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;num_requests_running&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Количество запросов, выполняемых в данный момент на графическом процессоре.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;num_requests_waiting&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Количество запросов, ожидающих обработки&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;prompt_tokens_total&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Количество обработанных токенов предварительного заполнения&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;request_failure_total&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Количество неудачных запросов; учитываются запросы с другими причинами завершения.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;request_finish_total&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Количество выполненных запросов с указанием причины завершения.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;request_generation_tokens&amp;lt;/code&amp;gt;&lt;br /&gt;
|histoGrailm&lt;br /&gt;
|integer&lt;br /&gt;
|Гистограмма количества обработанных токенов генерации.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;request_prompt_tokens&amp;lt;/code&amp;gt;&lt;br /&gt;
|histoGrailm&lt;br /&gt;
|integer&lt;br /&gt;
|Гистограмма количества обработанных токенов предварительного заполнения&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;request_success_total&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Количество успешных запросов; учитываются запросы с причиной завершения &amp;quot;stop&amp;quot; или &amp;quot;length&amp;quot;.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;time_per_output_token_seconds&amp;lt;/code&amp;gt;&lt;br /&gt;
|histoGrailm&lt;br /&gt;
|s&lt;br /&gt;
|Гистограмма времени на каждый выходной токен в секундах&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;time_to_first_token_seconds&amp;lt;/code&amp;gt;&lt;br /&gt;
|histoGrailm&lt;br /&gt;
|s&lt;br /&gt;
|Гистограмма времени до появления первого токена в секундах.&lt;br /&gt;
|}&lt;br /&gt;
Кроме того, предоставляются следующие метрики.&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
!Метрическая система&lt;br /&gt;
!Тип&lt;br /&gt;
!Единица&lt;br /&gt;
!Описание&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.client.generation.choices&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|&amp;lt;code&amp;gt;none&amp;lt;/code&amp;gt;&lt;br /&gt;
|Количество вариантов выбора, возвращаемых в результате выполнения запроса на завершение чата.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.client.operation.duration&amp;lt;/code&amp;gt;&lt;br /&gt;
|histogram&lt;br /&gt;
|&amp;lt;code&amp;gt;s&amp;lt;/code&amp;gt;&lt;br /&gt;
|Продолжительность работы GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.client.token.usage&amp;lt;/code&amp;gt;&lt;br /&gt;
|histogram&lt;br /&gt;
|&amp;lt;code&amp;gt;none&amp;lt;/code&amp;gt;&lt;br /&gt;
|Количество используемых входных и выходных токенов.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;llm.openai.embeddings.vector_size&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|&amp;lt;code&amp;gt;none&amp;lt;/code&amp;gt;&lt;br /&gt;
|Размер возвращаемого вектора.&lt;br /&gt;
|}&lt;/div&gt;</summary>
		<author><name>IKuznetsov</name></author>
	</entry>
</feed>