gemma-2-2b

输入: 文本字符串，如问题、提示或要总结的文档。
输出: 生成的英文文本，作为对输入问题的回答或文档的总结。

项目介绍：Gemma-2-2b

项目背景

Gemma-2-2b是Google开发的开放式大型语言模型家族中的一员，基于与Gemini模型相同的研究技术构建。它属于文本到文本的生成模型，旨在通过相对较小的体积来达到状态先进的水平。这种小巧的特点使得它可以在资源有限的环境中运行，比如笔记本、台式机或个人云基础设施，从而民主化地向每个人开放最新的人工智能技术，促进创新的发生。

使用方法

要使用Gemma-2-2b模型，首先需要安装Transformers库。以下是一些使用示例代码：

通过`pipeline` API运行

import torch
from transformers import pipeline

pipe = pipeline(
    "text-generation",
    model="google/gemma-2-2b",
    device="cuda",  # 如果在Mac设备上运行，则替换为"mps"
)

text = "Once upon a time,"
outputs = pipe(text, max_new_tokens=256)
response = outputs[0]["generated_text"]
print(response)

在单GPU或多GPU上运行

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tokenizer = AutoTokenizer.from_pretrained("google/gemma-2-2b")
model = AutoModelForCausalLM.from_pretrained(
    "google/gemma-2-2b",
    device_map="auto",
)

input_text = "Write me a poem about Machine Learning."
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids, max_new_tokens=32)
print(tokenizer.decode(outputs[0]))