Lightning-AI · lantiga · May 14, 2024 · May 11, 2024 · May 11, 2024 · May 11, 2024
@@ -61,7 +61,7 @@ Explore various examples that show different models deployed with LitServe:
 | Example  | description | Run |
 |---|---|---|
 | [Hello world](#implement-a-server)  | Hello world model | <a target="_blank" href="https://lightning.ai/lightning-ai/studios/litserve-hello-world"><img src="https://pl-bolts-doc-images.s3.us-east-2.amazonaws.com/app-2/studio-badge.svg" alt="Open In Studio"/></a> |
-| [Llama 3 (8B)](https://lightning.ai/lightning-ai/studios/deploy-a-private-llama-3-8b-api)  | **(LLM)** Deploy Llama 3 | <a target="_blank" href="https://lightning.ai/lightning-ai/studios/deploy-a-private-llama-3-8b-api"><img src="https://pl-bolts-doc-images.s3.us-east-2.amazonaws.com/app-2/studio-badge.svg" alt="Open In Studio"/></a> |    
+| [Llama 3 (8B)](https://lightning.ai/lightning-ai/studios/deploy-a-private-llama-3-8b-api)  | **(LLM)** Deploy Llama 3 | <a target="_blank" href="https://lightning.ai/lightning-ai/studios/deploy-a-private-llama-3-8b-api"><img src="https://pl-bolts-doc-images.s3.us-east-2.amazonaws.com/app-2/studio-badge.svg" alt="Open In Studio"/></a> |
 | [ANY Hugging face model](https://lightning.ai/lightning-ai/studios/deploy-any-hugging-face-model-instantly)  | **(Text)** Deploy any Hugging Face model | <a target="_blank" href="https://lightning.ai/lightning-ai/studios/deploy-any-hugging-face-model-instantly"><img src="https://pl-bolts-doc-images.s3.us-east-2.amazonaws.com/app-2/studio-badge.svg" alt="Open In Studio"/></a> |
 | [Hugging face BERT model](https://lightning.ai/lightning-ai/studios/deploy-a-hugging-face-bert-model)  | **(Text)** Deploy model for tasks like text generation and more | <a target="_blank" href="https://lightning.ai/lightning-ai/studios/deploy-a-hugging-face-bert-model"><img src="https://pl-bolts-doc-images.s3.us-east-2.amazonaws.com/app-2/studio-badge.svg" alt="Open In Studio"/></a>
 | [Open AI CLIP](https://lightning.ai/lightning-ai/studios/deploy-open-ai-clip-with-litserve)  | **(Multimodal)** Deploy Open AI CLIP for tasks like image understanding | <a target="_blank" href="https://lightning.ai/lightning-ai/studios/deploy-open-ai-clip-with-litserve"><img src="https://pl-bolts-doc-images.s3.us-east-2.amazonaws.com/app-2/studio-badge.svg" alt="Open In Studio"/></a>

@@ -12,8 +12,11 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
 import inspect
+import json
 from abc import ABC, abstractmethod
 
+from pydantic import BaseModel
+
 
 def no_batch_unbatch_message_no_stream(obj, data):
     return f"""
@@ -113,6 +116,13 @@ def encode_response(self, output):
         """
         pass
 
+    def format_encoded_response(self, data):
+        if isinstance(data, dict):
+            return json.dumps(data)
+        if isinstance(data, BaseModel):
+            return data.model_dump_json()
+        return data
+
     @property
     def stream(self):
         return self._stream

@@ -154,7 +154,7 @@ def run_single_loop(lit_api, request_queue: Queue, request_buffer):
                 pipe_s.send((pickle.dumps(e), LitAPIStatus.ERROR))
 
 
-def run_streaming_loop(lit_api, request_queue: Queue, request_buffer):
+def run_streaming_loop(lit_api: LitAPI, request_queue: Queue, request_buffer):
     while True:
         try:
             uid = request_queue.get(timeout=1.0)
@@ -171,6 +171,7 @@ def run_streaming_loop(lit_api, request_queue: Queue, request_buffer):
             y_enc_gen = lit_api.encode_response(y_gen)
             for y_enc in y_enc_gen:
                 with contextlib.suppress(BrokenPipeError):
+                    y_enc = lit_api.format_encoded_response(y_enc)
                     pipe_s.send((y_enc, LitAPIStatus.OK))
             with contextlib.suppress(BrokenPipeError):
                 pipe_s.send(("", LitAPIStatus.FINISH_STREAMING))
@@ -205,6 +206,7 @@ def run_batched_streaming_loop(lit_api, request_queue: Queue, request_buffer, ma
             for y_batch in y_enc_iter:
                 for y_enc, pipe_s in zip(y_batch, pipes):
                     with contextlib.suppress(BrokenPipeError):
+                        y_enc = lit_api.format_encoded_response(y_enc)
                         pipe_s.send((y_enc, LitAPIStatus.OK))
 
             for pipe_s in pipes:

@@ -197,6 +197,7 @@ def fake_encode(output):
     fake_stream_api.decode_request = MagicMock(side_effect=lambda x: x["prompt"])
     fake_stream_api.predict = MagicMock(side_effect=fake_predict)
     fake_stream_api.encode_response = MagicMock(side_effect=fake_encode)
+    fake_stream_api.format_encoded_response = MagicMock(side_effect=lambda x: x)
 
     _, requests_queue, request_buffer = loop_args
     request_buffer = Manager().dict()
@@ -249,6 +250,7 @@ def fake_encode(output_iter):
     fake_stream_api.predict = MagicMock(side_effect=fake_predict)
     fake_stream_api.encode_response = MagicMock(side_effect=fake_encode)
     fake_stream_api.unbatch = MagicMock(side_effect=lambda inputs: inputs)
+    fake_stream_api.format_encoded_response = MagicMock(side_effect=lambda x: x)
 
     _, requests_queue, request_buffer = loop_args
     request_buffer = Manager().dict()