内存分析
模块内容
class vllm.multimodal.profiling.ProcessorInputs(prompt_text: str, mm_data: ~collections.abc.Mapping[str, ~typing.Any | list[typing.Any]], hf_processor_mm_kwargs: ~collections.abc.Mapping[str, object] = <factory>)
表示 vllm.multimodal.processing.BaseMultiModalProcessor.apply()
的关键词参数。
class vllm.multimodal.profiling.DummyEncoderData(prompt_token_ids: list[int])
为分析多模态模型而构造虚拟数据的抽象基类。
字段编号 0 的别名。
class vllm.multimodal.profiling.DummyDecoderData(prompt_token_ids: list[int], multi_modal_data: MultiModalKwargs, multi_modal_placeholders: Mapping[str, Sequence[PlaceholderRange]])
用于分析的虚拟数据。
字段编号 0 的别名。
multi_modal_data_: MultiModalKwargs
字段编号 1 的别名。
multi_modal_placeholders_: Mapping[str, Sequence[PlaceholderRange]]
字段编号 2 的别名。
class vllm.multimodal.profiling.BaseDummyInputsBuilder(info: _I)
抽象基类,用于构造虚拟数据以分析多模态模型。
get_dummy_text(mm_counts: Mapping[str, int]) → str
构建与 mm_counts
对应的文本输入。
get_dummy_mm_data(seq_len: int, mm_counts: Mapping[str, int]) → Mapping[str, Any | list[Any]]
构建多模式输入,该输入在处理后会产生最大可能的占位符标记数。
get_dummy_processor_inputs(seq_len: int, mm_counts: Mapping[str, int]) → ProcessorInputs
构建输入,该输入在处理后会产生最大可能的占位符 token 数。
class vllm.multimodal.profiling.MultiModalProfiler(processor: BaseMultiModalProcessor[_I])
包含用于为多模态模型运行内存分析的代码。