feat: Added personality_weight (0.0–1.0) to chat API; modulates system…

- "backend/routers/chat.py" - "backend/chat_service.py" - "backend/tests/test_chat.py" GSD-Task: S02/T01
2026-04-04 09:28:35 +00:00 · 2026-04-04 09:28:35 +00:00 · 0856827b59
commit 0856827b59
parent 04630764a6
3 changed files with 394 additions and 2 deletions
--- a/backend/chat_service.py
+++ b/backend/chat_service.py
@ -21,9 +21,11 @@ import uuid
 from typing import Any, AsyncIterator
 import openai
 from sqlalchemy import select
 from sqlalchemy.ext.asyncio import AsyncSession
 from config import Settings
 from models import Creator
 from search_service import SearchService
 logger = logging.getLogger("chrysopedia.chat")
@ -95,12 +97,43 @@ class ChatService:
        except Exception:
            logger.warning("chat_history_save_error cid=%s", conversation_id, exc_info=True)
    async def _inject_personality(
        self,
        system_prompt: str,
        db: AsyncSession,
        creator_name: str,
        weight: float,
    ) -> str:
        """Query creator personality_profile and append a voice block to the system prompt.
        Falls back to the unmodified prompt on DB error, missing creator, or null profile.
        """
        try:
            result = await db.execute(
                select(Creator).where(Creator.name == creator_name)
            )
            creator_row = result.scalars().first()
        except Exception:
            logger.warning("chat_personality_db_error creator=%r", creator_name, exc_info=True)
            return system_prompt
        if creator_row is None or creator_row.personality_profile is None:
            logger.debug("chat_personality_skip creator=%r reason=%s",
                         creator_name,
                         "not_found" if creator_row is None else "null_profile")
            return system_prompt
        profile = creator_row.personality_profile
        voice_block = _build_personality_block(creator_name, profile, weight)
        return system_prompt + "\n\n" + voice_block
    async def stream_response(
        self,
        query: str,
        db: AsyncSession,
        creator: str | None = None,
        conversation_id: str | None = None,
        personality_weight: float = 0.0,
    ) -> AsyncIterator[str]:
        """Yield SSE-formatted events for a chat query.
@ -151,6 +184,15 @@ class ChatService:
        # ── 3. Stream LLM completion ────────────────────────────────────
        system_prompt = _SYSTEM_PROMPT_TEMPLATE.format(context_block=context_block)
        # Inject creator personality voice when weight > 0
        if personality_weight > 0 and creator:
            system_prompt = await self._inject_personality(
                system_prompt, db, creator, personality_weight,
            )
        # Scale temperature with personality weight: 0.3 (encyclopedic) → 0.5 (full personality)
        temperature = 0.3 + (personality_weight * 0.2)
        messages: list[dict[str, str]] = [
            {"role": "system", "content": system_prompt},
        ]
@ -165,7 +207,7 @@ class ChatService:
                model=self.settings.llm_model,
                messages=messages,
                stream=True,
-                temperature=0.3,
+                temperature=temperature,
                max_tokens=2048,
            )
@ -245,3 +287,47 @@ def _build_context_block(items: list[dict[str, Any]]) -> str:
        lines.append("")
    return "\n".join(lines)
 def _build_personality_block(creator_name: str, profile: dict[str, Any], weight: float) -> str:
    """Build a personality voice injection block from a creator's personality_profile JSONB.
    The ``weight`` (0.0–1.0) determines how strongly the personality should
    come through.  At low weights the instruction is softer ("subtly adopt");
    at high weights it is emphatic ("fully embody").
    """
    vocab = profile.get("vocabulary", {})
    tone = profile.get("tone", {})
    style = profile.get("style_markers", {})
    phrases = vocab.get("signature_phrases", [])
    descriptors = tone.get("descriptors", [])
    teaching_style = tone.get("teaching_style", "")
    energy = tone.get("energy", "moderate")
    formality = tone.get("formality", "conversational")
    parts: list[str] = []
    # Intensity qualifier
    if weight >= 0.8:
        parts.append(f"Fully embody {creator_name}'s voice and style.")
    elif weight >= 0.4:
        parts.append(f"Respond in {creator_name}'s voice.")
    else:
        parts.append(f"Subtly adopt {creator_name}'s communication style.")
    if teaching_style:
        parts.append(f"Teaching style: {teaching_style}.")
    if descriptors:
        parts.append(f"Tone: {', '.join(descriptors[:5])}.")
    if phrases:
        parts.append(f"Use their signature phrases: {', '.join(phrases[:6])}.")
    parts.append(f"Match their {formality} {energy} tone.")
    # Style markers
    if style.get("uses_analogies"):
        parts.append("Use analogies when helpful.")
    if style.get("audience_engagement"):
        parts.append(f"Audience engagement: {style['audience_engagement']}.")
    return " ".join(parts)
--- a/backend/routers/chat.py
+++ b/backend/routers/chat.py
@ -29,6 +29,7 @@ class ChatRequest(BaseModel):
    query: str = Field(..., min_length=1, max_length=1000)
    creator: str | None = None
    conversation_id: str | None = None
    personality_weight: float = Field(default=0.0, ge=0.0, le=1.0)
@router.post("")
@ -45,7 +46,7 @@ async def chat(
    - ``event: done``    — completion metadata with cascade_tier, conversation_id
    - ``event: error``   — error message (on failure)
    """
-    logger.info("chat_request query=%r creator=%r cid=%r", body.query, body.creator, body.conversation_id)
+    logger.info("chat_request query=%r creator=%r cid=%r weight=%.2f", body.query, body.creator, body.conversation_id, body.personality_weight)
    redis = await get_redis()
    service = ChatService(settings, redis=redis)
@ -56,6 +57,7 @@ async def chat(
            db=db,
            creator=body.creator,
            conversation_id=body.conversation_id,
            personality_weight=body.personality_weight,
        ),
        media_type="text/event-stream",
        headers={
--- a/backend/tests/test_chat.py
+++ b/backend/tests/test_chat.py
@ -563,3 +563,307 @@ async def test_single_turn_fallback_no_redis_history(chat_client, mock_redis):
    assert len(captured_messages) == 2
    assert captured_messages[0]["role"] == "system"
    assert captured_messages[1]["role"] == "user"
 # ── Personality weight tests ─────────────────────────────────────────────────
 _FAKE_PERSONALITY_PROFILE = {
    "vocabulary": {
        "signature_phrases": ["let's gooo", "that's fire"],
        "jargon_level": "mixed",
        "filler_words": [],
        "distinctive_terms": ["sauce", "vibes"],
        "sound_descriptions": ["crispy", "punchy"],
    },
    "tone": {
        "formality": "casual",
        "energy": "high",
        "humor": "occasional",
        "teaching_style": "hands-on demo-driven",
        "descriptors": ["enthusiastic", "direct", "encouraging"],
    },
    "style_markers": {
        "explanation_approach": "example-first",
        "uses_analogies": True,
        "analogy_examples": ["like cooking a steak"],
        "sound_words": ["brrr", "thwack"],
        "self_references": "I always",
        "audience_engagement": "asks rhetorical questions",
        "pacing": "fast",
    },
    "summary": "High-energy producer who teaches by doing.",
 }
 def _mock_creator_row(name: str, profile: dict | None):
    """Build a mock Creator ORM row with just the fields personality injection needs."""
    row = MagicMock()
    row.name = name
    row.personality_profile = profile
    return row
 def _mock_db_execute(creator_row):
    """Return a mock db.execute that yields a scalars().first() result."""
    mock_scalars = MagicMock()
    mock_scalars.first.return_value = creator_row
    mock_result = MagicMock()
    mock_result.scalars.return_value = mock_scalars
    return AsyncMock(return_value=mock_result)
@pytest.mark.asyncio
 async def test_personality_weight_accepted_and_forwarded(chat_client):
    """personality_weight is accepted in the request and forwarded to stream_response."""
    search_result = _fake_search_result()
    captured_kwargs = {}
    mock_openai_client = MagicMock()
    async def _capture_create(**kwargs):
        captured_kwargs.update(kwargs)
        return _mock_openai_stream(["ok"])
    mock_openai_client.chat.completions.create = AsyncMock(side_effect=_capture_create)
    with (
        patch("chat_service.SearchService.search", new_callable=AsyncMock, return_value=search_result),
        patch("chat_service.openai.AsyncOpenAI", return_value=mock_openai_client),
    ):
        resp = await chat_client.post(
            "/api/v1/chat",
            json={"query": "test", "creator": "Keota", "personality_weight": 0.7},
        )
    assert resp.status_code == 200
    events = _parse_sse(resp.text)
    event_types = [e["event"] for e in events]
    assert "done" in event_types
    # Temperature should reflect the weight: 0.3 + 0.7*0.2 = 0.44
    assert captured_kwargs.get("temperature") == pytest.approx(0.44)
@pytest.mark.asyncio
 async def test_personality_prompt_injected_when_weight_and_profile(chat_client):
    """System prompt includes personality context when weight > 0 and profile exists."""
    search_result = _fake_search_result()
    creator_row = _mock_creator_row("Keota", _FAKE_PERSONALITY_PROFILE)
    captured_messages = []
    mock_openai_client = MagicMock()
    async def _capture_create(**kwargs):
        captured_messages.extend(kwargs.get("messages", []))
        return _mock_openai_stream(["personality answer"])
    mock_openai_client.chat.completions.create = AsyncMock(side_effect=_capture_create)
    with (
        patch("chat_service.SearchService.search", new_callable=AsyncMock, return_value=search_result),
        patch("chat_service.openai.AsyncOpenAI", return_value=mock_openai_client),
    ):
        # We need to mock db.execute inside the service — override the session
        mock_session = AsyncMock()
        mock_session.execute = _mock_db_execute(creator_row)
        async def _mock_get_session():
            yield mock_session
        app.dependency_overrides[get_session] = _mock_get_session
        resp = await chat_client.post(
            "/api/v1/chat",
            json={"query": "snare tips", "creator": "Keota", "personality_weight": 0.7},
        )
    assert resp.status_code == 200
    assert len(captured_messages) >= 2
    system_prompt = captured_messages[0]["content"]
    # Personality block should be appended
    assert "Keota" in system_prompt
    assert "let's gooo" in system_prompt
    assert "hands-on demo-driven" in system_prompt
    assert "casual" in system_prompt
    assert "high" in system_prompt
@pytest.mark.asyncio
 async def test_personality_encyclopedic_fallback_null_profile(chat_client):
    """When weight > 0 but personality_profile is null, falls back to encyclopedic prompt."""
    search_result = _fake_search_result()
    creator_row = _mock_creator_row("NullCreator", None)
    captured_messages = []
    mock_openai_client = MagicMock()
    async def _capture_create(**kwargs):
        captured_messages.extend(kwargs.get("messages", []))
        return _mock_openai_stream(["encyclopedic answer"])
    mock_openai_client.chat.completions.create = AsyncMock(side_effect=_capture_create)
    with (
        patch("chat_service.SearchService.search", new_callable=AsyncMock, return_value=search_result),
        patch("chat_service.openai.AsyncOpenAI", return_value=mock_openai_client),
    ):
        mock_session = AsyncMock()
        mock_session.execute = _mock_db_execute(creator_row)
        async def _mock_get_session():
            yield mock_session
        app.dependency_overrides[get_session] = _mock_get_session
        resp = await chat_client.post(
            "/api/v1/chat",
            json={"query": "reverb tips", "creator": "NullCreator", "personality_weight": 0.5},
        )
    assert resp.status_code == 200
    system_prompt = captured_messages[0]["content"]
    # Should be the standard encyclopedic prompt, no personality injection
    assert "Chrysopedia" in system_prompt
    assert "NullCreator" not in system_prompt
@pytest.mark.asyncio
 async def test_personality_encyclopedic_fallback_missing_creator(chat_client):
    """When weight > 0 but creator doesn't exist in DB, falls back to encyclopedic prompt."""
    search_result = _fake_search_result()
    captured_messages = []
    mock_openai_client = MagicMock()
    async def _capture_create(**kwargs):
        captured_messages.extend(kwargs.get("messages", []))
        return _mock_openai_stream(["encyclopedic answer"])
    mock_openai_client.chat.completions.create = AsyncMock(side_effect=_capture_create)
    with (
        patch("chat_service.SearchService.search", new_callable=AsyncMock, return_value=search_result),
        patch("chat_service.openai.AsyncOpenAI", return_value=mock_openai_client),
    ):
        mock_session = AsyncMock()
        mock_session.execute = _mock_db_execute(None)  # No creator found
        async def _mock_get_session():
            yield mock_session
        app.dependency_overrides[get_session] = _mock_get_session
        resp = await chat_client.post(
            "/api/v1/chat",
            json={"query": "bass tips", "creator": "GhostCreator", "personality_weight": 0.8},
        )
    assert resp.status_code == 200
    system_prompt = captured_messages[0]["content"]
    assert "Chrysopedia" in system_prompt
    assert "GhostCreator" not in system_prompt
@pytest.mark.asyncio
 async def test_personality_weight_zero_skips_profile_query(chat_client):
    """When weight is 0.0, no Creator query is made even if creator is set."""
    search_result = _fake_search_result()
    captured_kwargs = {}
    mock_openai_client = MagicMock()
    async def _capture_create(**kwargs):
        captured_kwargs.update(kwargs)
        return _mock_openai_stream(["ok"])
    mock_openai_client.chat.completions.create = AsyncMock(side_effect=_capture_create)
    with (
        patch("chat_service.SearchService.search", new_callable=AsyncMock, return_value=search_result),
        patch("chat_service.openai.AsyncOpenAI", return_value=mock_openai_client),
    ):
        mock_session = AsyncMock()
        mock_session.execute = AsyncMock()  # Should NOT be called
        async def _mock_get_session():
            yield mock_session
        app.dependency_overrides[get_session] = _mock_get_session
        resp = await chat_client.post(
            "/api/v1/chat",
            json={"query": "test", "creator": "Keota", "personality_weight": 0.0},
        )
    assert resp.status_code == 200
    # DB execute should not have been called for Creator lookup
    mock_session.execute.assert_not_called()
    # Temperature should be 0.3 (base)
    assert captured_kwargs.get("temperature") == pytest.approx(0.3)
@pytest.mark.asyncio
 async def test_personality_temperature_scales_with_weight(chat_client):
    """Temperature scales: 0.3 at weight=0.0, 0.5 at weight=1.0."""
    search_result = _fake_search_result()
    creator_row = _mock_creator_row("Keota", _FAKE_PERSONALITY_PROFILE)
    captured_kwargs = {}
    mock_openai_client = MagicMock()
    async def _capture_create(**kwargs):
        captured_kwargs.update(kwargs)
        return _mock_openai_stream(["warm"])
    mock_openai_client.chat.completions.create = AsyncMock(side_effect=_capture_create)
    with (
        patch("chat_service.SearchService.search", new_callable=AsyncMock, return_value=search_result),
        patch("chat_service.openai.AsyncOpenAI", return_value=mock_openai_client),
    ):
        mock_session = AsyncMock()
        mock_session.execute = _mock_db_execute(creator_row)
        async def _mock_get_session():
            yield mock_session
        app.dependency_overrides[get_session] = _mock_get_session
        resp = await chat_client.post(
            "/api/v1/chat",
            json={"query": "test", "creator": "Keota", "personality_weight": 1.0},
        )
    assert resp.status_code == 200
    assert captured_kwargs.get("temperature") == pytest.approx(0.5)
@pytest.mark.asyncio
 async def test_personality_weight_above_1_returns_422(chat_client):
    """personality_weight > 1.0 fails Pydantic validation with 422."""
    resp = await chat_client.post(
        "/api/v1/chat",
        json={"query": "test", "personality_weight": 1.5},
    )
    assert resp.status_code == 422
@pytest.mark.asyncio
 async def test_personality_weight_below_0_returns_422(chat_client):
    """personality_weight < 0.0 fails Pydantic validation with 422."""
    resp = await chat_client.post(
        "/api/v1/chat",
        json={"query": "test", "personality_weight": -0.1},
    )
    assert resp.status_code == 422
@pytest.mark.asyncio
 async def test_personality_weight_string_returns_422(chat_client):
    """personality_weight as a non-numeric string fails validation with 422."""
    resp = await chat_client.post(
        "/api/v1/chat",
        json={"query": "test", "personality_weight": "high"},
    )
    assert resp.status_code == 422